﻿Florin A Sava PSiHOLOGiA VALiDATa sTiiNtiFiC Л A Ghid practic de cercetare in psihologie (sllegium Florin A Sava PSiHOLOGiA VALiDATa sTiiNtiFiC Ghid practic de cercetare in psihologie Prefata de Daniel David 9 POLiROM 2013 www polirom ro Editura POLiROM iasi, B-dul Carol i nr 4; P O BOX 266, 700506 Bucuresti, Splaiul Unirii nr 6, bl B3A, sc 1, et 1; sector 4, 040031, O P 53, C P 15-728 iSBN ePub: 978-973-46-3272-5 iSBN PDF: 978-973-46-3273-2 iSBN print: 978-973-46-2238-2 Coperta: Laurentiu Midvichi Pe coperta: © Spectral-Design Shutterstock com Aceasta carte in format digital (e-book) este protejata prin Copyright si este destinata exclusiv utilizarii ei in scop privat pe dispozitivul de citire pe care a fost descarcata Orice alta utilizare, incluzand imprumutul sau schimbul, reproducerea integrala sau partiala, multiplicarea, inchirierea, punerea la dispozitia publica, inclusiv prin internet sau prin retele de calculatoare, stocarea permanenta sau temporara pe dispozitive sau sisteme cu posibilitatea recuperarii informatiei, altele decat cele pe care a fost descarcata, revanzarea sau comercializarea sub orice forma, precum si alte fapte similare savarsite fara permisiunea scrisa a detinatorului copyrightului reprezinta o incalcare a legislatiei cu privire la protectia proprietatii intelectuale si se pedepsesc penal si sau civil in conformitate cu legile in vigoare Lectura digitala protejeaza mediul Versiune digitala realizata in colaborare cu elefant ro FLORiN A SAVA este reprezentantul domeniilor Psihologie si Psihoterapie in cadrul Comisiei de stiinte Sociale a Consiliului National al Cercetarii stiintifice, directorul departamentului de Psihologie din cadrul Universitatii de Vest din Timisoara si coordonatorul Laboratorului de Cognitii Sociale si Evaluare a Personalitatii (http:  socpers psihologietm ro) Printre preocuparile sale stiintifice se regasesc evaluarea personalitatii si a inteligentei, precum si masuratorile si interventiile implicite validate stiintific interesul pentru cercetare a fost completat, in plan national, cu activitatea de diseminare a cunostintelor din domeniul metodologiei cercetarii si al analizei datelor De acelasi autor: Analiza datelor in cercetarea psihologica (2004, 2011), Metode implicite de investigare a personalitatii (coord , Polirom, 2011) Familiei mele, Laura, Rares si Sonia, pentru felul lor molipsitor de a se bucura in fiecare zi Prefata in domeniul psihologiei din Romania se publica foarte multe carti Putine sunt insa cele care conteaza cu adevarat, devenind repere la nivel national Aceasta este o carte care conteaza si care cred ca va deveni un reper pentru psihologia romaneasca scoala clujeana de psihologie este cea care a promovat in psihologia din tara, in mod explicit si programatic, metoda stiintifica experimentala intr-adevar, primul institut de Psihologie Experimentala din Romania a fost infiintat in 1921 la Cluj de catre profesorul Florian stefanescu-Goanga, fost student al lui Wilhelm Wundt, care este considerat la nivel international fondatorul psihologiei Autorul acestei lucrari, conferentiarul Florin Alin Sava, este, prin studiile la nivel de licenta si masterat, un produs al scolii de psihologie din Timisoara, iar prin studiile la nivel de doctorat si postdoctorat, un produs al scolii clujene de psihologie Asadar, substratul experimental si stiintific riguros este fundamentul activitatilor academice si de cercetare performante ale colegului Florin Alin Sava scoala clujeana de psihologie a generat dupa revolutia din 1989 (nu mai pomenesc aici lucrarile monumentale dinainte de revolutie) o serie de publicatii fundamentale pentru psihologia experimentala din Romania Astfel, fundamentele initiale au fost puse de o lucrare coordonata de profesorul ioan Radu (Radu si colab , 1993, Metodologie psihologica si analiza datelor, Sincron, Cluj-Napoca) Ulterior, Florin Alin Sava publica o lucrare care completeaza excelent lucrarea profesorului Radu, aducand in atentia cititorului metode si tehnici noi si sau detaliind critic metodele traditionale (Sava, 2004 2011, Analiza datelor in cercetarea psihologica Metode statistice complementare, ASCR, Cluj-Napoca) Am extins apoi aceste fundamente experimentale in domeniul clinic (David, 2006, Metodologia cercetarii clinice Fundamente, Polirom, iasi) Prin lucrarea de fata, Florin Alin Sava completeaza excelent lucrarile mentionate anterior prin extinderea metodologiei cercetarii psihologice in contextul practicii psihologice validate stiintific (evidence-based practice), cu accent, fara a fi exclusiv, pe domeniul clinic Lucrarea colegului Florin Alin Sava este una complexa, foarte bine gandita si structurata, acoperind aspecte teoretice (de exemplu, problematica pseudostiintei), metodologice (de exemplu, metaanaliza, studiul clinic controlat) si practice (de exemplu, raportarea rezultatelor in articole), foarte importante pentru psihologia moderna Sigur, nu este o lucrare usor de parcurs si inteles - fiind totusi o lucrare stiintifica care abordeaza aspecte dificile -, dar este usor de citit, fiind bine scrisa in plus, lucrarea provoaca si stimuleaza, devenind treptat un manual personal de know-how, la care ne putem raporta mereu in cercetari si sau publicarea articolelor stiintifice Asa cum am afirmat anterior, cred sincer ca aceasta lucrare va deveni un reper in familia lucrarilor de metodologia cercetarii in psihologie publicate in tara, fiind necesara si utila unui public divers De aceea o recomand cu toata increderea nu doar studentilor, ci oricarui cercetator serios din psihologie, in particular, si din stiintele socioumane, in general Prof univ dr Daniel David Universitatea "Babes-Bolyai", Cluj-Napoca, Romania (profesor) Mount Sinai School of Medicine, New York, SUA (profesor asociat) Cuvant inainte Pentru cei mai multi dintre cei care ajung sa rasfoiasca sau sa citeasca acest volum, psihologia reprezinta un domeniu fascinant si complex, ce ofera o perspectiva aparte asupra realitatii inconjuratoare si care, de ce nu, reprezinta un mijloc de trai prezent sau viitor in interiorul psihologiei avem libertatea de a alege anumite perspective teoretice carora le devenim loiali, in care credem si pe care ajungem, la randul nostru, sa le promovam catre ceilalti, fie aflati in interiorul breslei (studenti, practicieni sau oameni din sfera academica), fie din afara ei (pasionatii de psihologie si beneficiarii serviciilor psihologice) indragim aceste modele si explicatii psihologice pentru ca ni se potrivesc, pentru ca rezonam afectiv cu ele si ajungem sa le imbratisam, fara a cauta dovezi solide sau rationamente logice, atent construite, pentru a le accepta Sloganul sub care se desfasoara intreg acest scenariu este presarat cu intentii bune, consumatorii de psihologie fiind invitati sa isi aleaga abordarea care li se potriveste, pentru ca este suficient loc pentru toate perspectivele teoretice in psihologie si, intr-adevar, aceasta diversitate productiva a permis psihologiei sa evolueze si sa isi extinda influenta dincolo de granitele sale clasice, dincolo de disputele traditionale dintre psihanaliza, behaviorism, abordarea umanista sau cognitivism Astazi, din ce in ce mai multi psihologi lucreaza in neurostiintele cognitive - pentru a stabili legatura dintre procesele cognitive si creier; in genetica - pentru a stabili legatura dintre anumite structuri genetice si comportament; in medicina - pentru a stabili legatura dintre anumite constructe psihologice si riscul imbolnavirii etc Psihologia si-a extins influenta nu doar in zona stiintifica, ci si in aceea a spiritualitatii De exemplu, intreg domeniul New Age este saturat in explicatii de natura psihologica Parafrazand o expresie comuna, as spune ca sub umbrela psihologiei a fost loc pentru toata lumea Filosofia acestei carti pune la indoiala o asemenea perspectiva liberala Lucrarea este inradacinata in perspectiva abordarii validate stiintific (evidence-based approach), initiata in interiorul stiintelor medicale Aceasta perspectiva este una ateoretica, prin urmare nu veti gasi alte paradigme de explicare a comportamentului uman decat cele deja consacrate Ceea ce face abordarea validata stiintific este sa analizeze critic modelele teoretice existente in psihologie, utilizand aparatul stiintific in termenii unei analogii, daca presa este cainele de paza al democratiei, am putea spune ca abordarea validata stiintific este gardianul oricarei stiinte empirice in absenta vocii (perspectivei) abordarii validate stiintific, psihologia este amenintata sa fie parazitata de abordari pseudostiintifice daunatoare nu numai pentru ea ca stiinta, ci si pentru beneficiarii serviciilor psihologice in primele doua capitole ale cartii vom insista asupra educarii publicului pentru a diferentia intre stiinta si pseudostiinta in psihologie si asupra prezentarii premiselor si pasilor de lucru in practica psihologica, astfel incat serviciile psihologice oferite sa fie unele validate stiintific Astfel, la fel ca in alte stiinte preocupate de optimizarea comportamentului uman si de rezolvarea unor probleme care pot afecta sanatatea si calitatea vietii unui individ, si in psihologie avem nevoie: (a) sa stim ca interventia oferita pentru problema constatata este una eficienta (in urma unui demers stiintific); (b) sa stim de ce interventia oferita este una eficienta, pentru a-i potenta efectul si pentru a cunoaste mai bine mecanismele psihologice implicate (in urma unui demers stiintific); (c) sa stim, din respect pentru clientii nostri, dar si din constrangeri bugetare, ca solutia aleasa pentru problema lor are cel mai bun raport cost-eficienta (desigur, tot printr-un demers stiintific) Abordarea validata stiintific are in vedere toate cele trei puncte mentionate, dar mai cu seama pe primele doua Celelalte sase capitole sunt rezervate subiectului principal al lucrarii de fata, adica descrierii demersului de cercetare necesar pentru a afirma despre un serviciu psihologic oferit ca este unul validat stiintific (adica un serviciu eficient, fundamentat pe un model teoretic valid si cu un bun raport cost-eficienta) Astfel, capitolul 3, unul dintre cele mai importante capitole ale lucrarii, prezinta o grila de lectura a studiilor empirice din psihologie, prin componentele critice necesare realizarii si sau evaluarii unui demers de cercetare in cadrul capitolului am subliniat in numeroase randuri importanta dinamicii dintre obiectivele cercetarii (ceea ce-si propune studiul) si validitatea cercetarii (metodologia si mijloacele de analiza a datelor utilizate pentru a raspunde adecvat la obiectivul studiului) Demersul stiintific este, apoi, detaliat in patru capitole succesive (4-7), fiecare prezentand tipurile principale de studii intalnite: cele experimentale si cvasiexperimentale (capitolul 4), cele non-experimentale (capitolul 5), studiile de tip cost-eficienta (capitolul 6) si cele metaanalitice (capitolul 7) Lucrarea se incheie cu un capitol destinat redactarii articolelor stiintifice (capitolul 8), scris din dorinta de a ajuta studentii, masteranzii si doctoranzii sa inteleaga standardele de publicare din domeniul psihologiei, sa-si intareasca simtul critic atunci cand lectureaza rezultatele unor studii si, de ce nu, sa-i ajute sa scrie mai bine lucrarile stiintifice pe care le au de redactat Toate aceste cinci capitole sunt scrise intr-o maniera practica, oferind cititorilor o serie de sugestii si recomandari despre cum sa deruleze astfel de studii si cum sa reflecteze critic asupra rezultatelor obtinute, constituind, astfel, un veritabil manual de metodologie a cercetarii Utilitatea continuturilor prezentate depaseste cadrul discutiei despre psihologia validata stiintific, informatiile fiind relevante pentru a intelege demersul de cercetare din intreaga zona a stiintelor comportamentale Prin complexitatea unor analize prezentate, lucrarea raspunde mai bine nevoilor specialistilor in psihologie decat amatorilor de psihologie Specialistii in psihologie vor gasi in acest volum acele informatii care sa-i ajute sa faca pasul de la textele introductive de metodologia cercetarii la cerintele necesare pentru a analiza critic rezultatele studiilor lecturate si de a efectua cercetari competitive la nivel international Amatorii de psihologie vor intelege mai bine eforturile psihologiei ca stiinta, astfel incat sa ajunga sa distinga intre serviciile psihologice bine fundamentate si abordarile ezoterice Acest lucru ii va ajuta sa devina consumatori inteligenti de psihologie si sa pretuiasca actul psihologic fundamentat stiintific in final, as dori sa multumesc celor care au contribuit la efortul de a duce la bun sfarsit acest proiect As incepe cu cei care au fost primii mei cititori si care m-au ajutat sa calibrez complexitatea continuturilor prezentate spre beneficiul masteranzilor si al doctoranzilor Este vorba de Otilia Matei (masteranda) si de colaboratorii mei cei mai apropiati, doctoranzii Andrei Rusu si Silvia Rusu Apoi i-as aminti pe Dr Laurentiu Maricutoiu si Dr Sebastian Pintea, a caror consultanta tehnica oferita a fost extrem de folositoare Nu in ultimul rand, ii multumesc profesorului universitar clujean Daniel David pentru feedbackul sau consistent si pertinent legat de continutul unor capitole, dar mai ales pentru efortul sustinut pe care-l depune in promovarea psihologiei validate stiintific ca reper prescriptiv in activitatea oricarui psiholog Este un deziderat in care cred si in folosul caruia sper sa contribuie aceasta carte, prin impactul ei in comunitatea psihologilor din Romania Am lasat la final multumirile pentru cei alaturi de care incep mereu o noua zi, Sonia, Rares si Laura Le multumesc pentru suportul afectiv si pentru momentele de inspiratie prilejuite Florin A Sava Timisoara, 2013 Partea intai Fundamentele cercetarii stiintifice in psihologie Capitolul 1 Abordarea stiintifica vs pseudostiintificain psihologie 1 1 Expansiunea psihologiei in societate indeosebi dupa cel de-al Doilea Razboi Mondial, psihologia a devenit un domeniu stiintific si aplicativ aflat intr-o crestere exponentiala, ce continua inclusiv in prezent O statistica realizata de Sexton si Hogan reprezentativa pentru SUA (1992 apud Louw, 2002) plaseaza psihologia pe locul trei, ca ritm de crestere a numarului de studenti, dupa informatica si matematica Aceasta situatie nu este insa una izolata, ea fiind prezenta in foarte multe tari europene, precum si in statele cu o economie bine dezvoltata cum ar fi Australia, Canada etc Bunaoara, numai in Australia, contributia serviciilor psihologice la produsul intern brut a crescut in zece ani cu 500% fata de 1991, iar numarul studentilor care urmeaza studii de master sau doctorat din domeniul psihologiei aproape s-a dublat in aceeasi perioada (Patrick, 2005) Aceeasi situatie, ce reflecta un interes deosebit pentru psihologie, se regaseste si in societatea romaneasca De pilda, datele de mai jos descriu o situatie particulara, cea a admiterii la Universitatea de Vest din Timisoara: in sesiunea din iulie 2011, psihologia a ocupat locul 3 ca numar de studenti inscrisi in anul i, dupa stiintele economice si drept Serviciile psihologice nu au crescut insa numai cantitativ, ci s-au si diversificat, dezvoltand noi nise de piata din perspectiva serviciilor psihologice oferite (Goodheart, 2010) Cu toate ca majoritatea serviciilor de psihologie se regasesc in sfera psihologiei clinice si a consilierii psihologice (55% dintre psihologii din intreaga lume fiind psihologi clinicieni sau consilieri psihologici - vezi Sexton si Hogan, 1992 apud Louw, 2002), in ultima vreme asistam la o crestere a serviciilor psihologice in arii din ce in ce mai variate, precum domeniile industriei si afacerilor, juridic, militar, sportiv, in publicitate si politica etc O posibila explicatie, de sorginte filosofica, pentru expansiunea psihologiei consta in nivelul ridicat de insecuritate pe care il resimte o persoana in incercarea sa de a se adapta la provocarile lumii contemporane (Savage, 2009), psihologia fiind domeniul care ofera indivizilor afectati de aceste provocari, modalitati adecvate de coping, potrivite unei societati de tip secularizat O alta explicatie de tip filosofic pune expansiunea psihologiei pe seama aparitiei societatii capitaliste postindustriale de tip occidental, care se caracterizeaza printr-un sistem liberal avansat, ce confera cetatenilor sai o serie de drepturi si libertati Valori precum individualismul sau libertatea de a decide ocupa un rol principal in discursul public, iar grija primordiala a guvernantilor este de a oferi cat mai multor indivizi o viata in care sanatatea, fericirea si bunastarea personala sunt scopuri de atins (Jansz, 2004, Louw, 2002) Din acest punct de vedere, psihologia este domeniul stiintific care poate contribui eficient la bunastarea individuala Discursurile din mass-media despre nevoile individuale ale fiecaruia si despre dreptul fiecaruia dintre noi de a-si satisface aceste nevoi ("pentru ca merit!"), dublate de industria de tip self-help care a dobandit un caracter de masa ("pentru a evolua emotional si spiritual!") au condus la dezvoltarea abordarii de tip psihologic in societatea contemporana Aceasta explozie in mass-media, dublata de preocuparea cinematografiei de pretutindeni pentru ecranizarea unor scenarii cu incarcatura psihologica, au contribuit la constituirea unei societatii psihologizate (Jansz, 2004), fapt ce i-a determinat pe unii autori precum Gross (1979, p 3 apud Louw, 2002) sa afirme: "Astazi, psihologia este arta, stiinta, terapie, religie, cod moral, stil de viata, filosofie si cult miezul societatii contemporane" in sfarsit, o a treia explicatie posibila pentru expansiunea psihologiei ca stiinta, isi are originea in modificarea implicarii statului in mentinerea si promovarea sanatatii cetatenilor sai, prin reconceptualizarea modului in care se face asistenta sociala si asistenta medicala acordata populatiei Acest lucru a condus nu numai la dezvoltarea serviciilor de psihologie clinica si consiliere psihologica, ci si la patrunderea cunostintelor de psihologie in pregatirea profesionala a altor ocupatii din sfera asistentei medicale si sociale Pe langa beneficiile aduse de includerea serviciilor psihologice in practica asistentei medicale sociale, care au condus la cresterea cererii de servicii psihologice pe piata, aceasta practica a condus, adeseori, la perceptia gresita din partea oamenilor de rand ca psihologia se ocupa doar de oameni aflati in situatii de suferinta emotionala ca urmare a instalarii unor tulburari psihopatologice sau a problemelor familiale profesionale ce necesita consiliere (Levant, 2003) 1 2 Costurile expansiunii sociale asupra psihologiei ca stiinta Beneficiile expansiunii psihologiei in societatea actuala sunt insotite, insa, de o serie de costuri pe care psihologia, ca domeniu stiintific le plateste adesea Pe scurt ele s-ar putea incadra in patru mari categorii: (a) superficialitatea discursului psihologic public; (b) distorsionarea continutului public referitor la psihologie; (c) asocierea in mod eronat a psihologiei cu spiritualitatea; (d) dezvoltarea unei industrii alternative bazata pe pseudostiinte 1 2 1 Superficialitatea discursului psihologic public intr-o buna masura, publicul a prins gustul discutiilor si interpretarilor cu iz psihologic in cercurile de intelectuali si filosofi, cat si in domeniul stiintelor umaniste, influenta lui Freud si a constructelor psihanalitice a devenit una relevanta pentru evolutia domeniului Publicul larg, prin intermediul emisiunilor TV sau a articolelor din presa, a incorporat in vocabularul sau expresii de genul "criza de identitate", "reprimarea nevoilor", "dezvoltare personala", "stima de sine" etc Dezbaterile de acest gen au dezvoltat publicului senzatia ca in psihologie, ca in politica, oricine isi poate exprima o parere competenta, ca discursul psihologic este unul facil, de bun-simt Din nefericire, la aceasta impresie au contribuit inclusiv specialistii prezenti in mass-media, psihologi sau psihoterapeuti cu notorietate, dar fara contributii stiintifice relevante in domeniu in interpretarea diferitelor evenimente, ei apeleaza frecvent, fie la explicatii tipice simtului comun, lipsite de specificitatea unei adevarate relatii de tip cauza-efect (de exemplu, "problemele adolescentilor provin aproape intotdeauna din criza lor de identitate si din conflictul existent intre generatii"), fie, mai grav, promoveaza o serie de credinte populare, dar false din punct de vedere stiintific (de exemplu, "majoritatea oamenilor folosesc doar 10% din capacitatea creierului") Pentru o lista de mituri (credinte populare) fara fundamentare stiintifica puteti consulta traducerea lucrarii lui Lilienfeld, Lynn, Ruscio si Beyerstein (2010) 1 2 2 Distorsionarea continutului public referitor la psihologie in prefata aceleiasi lucrari (Lilienfeld et al , 2010, pp 13-14) se afirma ca "psihologia este peste tot in jurul nostru in fiecare zi, stirile, programele de televiziune, filmele si internetul ne bombardeaza cu tot felul de presupozitii in ceea ce priveste o multime de subiecte psihologice in lumea grabita a supraincarcarii informationale, dezinformarea referitoare la psihologie este cel putin la fel de raspandita ca informatia corecta" Acest lucru poate fi observat direct la o parte insemnata dintre studentii anului i, ciclul licenta, care au asteptari nerealiste despre ce vor invata la specializarea psihologie in mentalul lor se regasesc mai degraba topici apropiate de ideea senzationalului (de exemplu, tulburarile mentale si abuzul sexual asupra copiilor) sau topici legate de domeniul parapsihologiei (de exemplu, experientele in afara corpului, visele premonitorii etc ), decat topici specifice unei abordari stiintifice a psihologiei precum neuropsihologia sau invatarea bazata pe conditionare operanta Distorsionarea continutului public al psihologiei are loc si la un alt nivel, cel al diferentelor intre agenda publica (psihologia populara) si agenda psihologiei stiintifice in acest sens, Stanovich (2010) remarca foarte bine ca exista o discrepanta majora intre temele de interes public de sorginte psihologica si temele actuale din cercetarea psihologica De pilda, pentru public, cele mai cunoscute teorii psihologice sunt cele dezvoltate de Freud si de sustinatorii sai Acestea constituie cel mai adesea reprezentarea in mentalul colectiv a domeniului psihologiei in abordarea stiintifica, insa, conceptele lui Freud constituie adesea informatii complementare prezentate in orice manual introductiv de psihologie, reprezentand doar 1-2% din continutul psihologic prezentat Mai mult, cel mai adesea aceste informatii sunt prezentate intr-un context critic, subliniind limitele teoriei psihanalitice 1 2 3 Asocierea eronata a psihologiei cu spiritualitatea Poate e greu de crezut, dar cu aproximativ 100 de ani in urma prestigioasa universitate britanica Cambridge a refuzat infiintarea unui laborator de psihofizica deoarece acesta ar "insulta religia, prin faptul de a masura sufletul omului prin intermediul unui set de scale" (Hearst, 1979 apud Stanovich, 2010, p 17) Aceasta tendinta de a intersecta (asocia) psihologia cu problemele de spiritualitate a ramas constanta in timp, iar in urma secularizarii societatii actuale si a dezvoltarii unor directii de studiu precum psihologia transpersonala sau psihologia umanista s-a obtinut chiar un discurs ce imbina concepte psihologice si spirituale, atractiv pentru o buna parte a publicului Acest lucru este valabil indeosebi pentru adeptii unei viziuni holiste (Kendler, 1999), care au tendinta de a cauta explicatii de sorginte spirituala despre functionarea organismului uman, tinzand sa caute mereu o explicatie de genul "intregul este mai mult decat suma partilor" si sa foloseasca eventualele dovezi stiintifice colaterale drept punct central de sprijin al ipotezei lor ca exista ceva dincolo de lumea materiala Amalgamul de dovezi stiintifice, de filosofie si de idei religioase (spirituale) poate fi extrem de atragator pentru aceste persoane aflate in cautarea fericirii si confortului spiritual, dar daunator pentru psihologie ca domeniu stiintific Aceasta stare de fapt a condus la o explozie a literaturii de tip self-help, cele mai multe dintre aceste carti sunt facute sa se vanda, nu sa ajute, fiind arareori fundamentate stiintific (Kaminer, 1992) Aceeasi preocupare pentru spiritualitate a condus la integrarea unor metode si tehnici psihologice intr-un domeniu mai larg, cel al medicinei alternative 1 2 4 Proliferarea unei industrii alternative bazata pe metode pseudostiintifice inclinatia mintii umane spre a accepta drept valide anumite credinte nefundamentate stiintific este extrem de ridicata in SUA exista de 20 de ori mai multi astrologi decat astronomi, iar 50% dintre adultii americani cred in posibilitatea de a comunica cu cei decedati, in vindecarea prin credinta sau in astrologie (Lilienfeld, Lohr si Morier, 2001) Situatia este similara si in alte parti, inclusiv in Romania, unde un sondaj recent a reflectat ca 40% dintre romani cred ca astrologia le influenteaza viata, iar aproape 50% (sic!) cred in continuare ca Soarele se invarte in jurul Pamantului, in timp ce o treime sunt absolut convinsi ca exista oameni posedati de diavol (Vlasceanu, Dusa si Rughinis, 2010) Un episod elocvent, de notorietate, intalnit la noi este cel din campania prezidentiala de la finalul anului 2009, cand unul dintre candidati l-a acuzat pe celalalt ca utilizeaza proprietatile "flacarii violete" pentru a fi protejat energetic, demers prezentat pe larg in mass-media, dar sanctionat prin intermediul unei scrisori deschise cu iz pamfletar (David, 2010) Proliferarea pseudostiintelor pe un asemenea taram mental devine una evidenta, iar psihologia, ca domeniu stiintific a fost, la randul sau, afectata Trebuie precizat de la inceput ca pseudostiinta nu este determinata de obiectul studiat, ci de modul de raportare la metodele stiintifice (Lilienfeld, Lynn si Lohr, 2004) Prin pseudostiinta (insemnand stiinta falsa) se intelege un demers aparent stiintific, dar care isi apara descoperirile deviind de la metodele stiintifice, mai ales atunci cand rezultatele empirice obtinute neaga concluziile pe care le sustin in termeni plastici, pseudostiintele joaca rolul unor impostori, pretinzand ca joaca dupa regulile stiintei, pe care totusi nu le respecta in urma acestei abordari, oamenii cu un nivel mai scazut de pregatire in cultura si metodologia stiintifica pot ajunge sa considere asemenea demersuri ca fiind valide, desi nu este cazul (Lilienfeld si Landfield, 2008) Pseudostiintele pot lua atat forme grosiere de manifestare (cum ar fi cazul frenologiei), cat si forme subtile, adesea sub forma unor tehnici variate de interventie in vederea optimizarii comportamentului uman (neuroprogramarea lingvistica, terapia strigatului primar, tehnicile de autosugestie prin mesaje subliminale etc ) 1 3 Descriptori specifici ai pseudostiintelor Distinctia dintre stiinte si pseudostiinte se poate face pe seama unor indicatori Cu cat o abordare particulara are mai multe caracteristici specifice pseudostiintei, cu atat mai usor este de diferentiat aceasta abordare in sfera pseudostiintelor Cu cat o abordare specifica are mai putine caracteristici specifice pseudostiintei, cu atat este mai dificil de diferentiat in privinta acelei abordari daca este o abordare stiintifica sau pseudostiintifica (Lilienfeld et al , 2004; Stanovich, 2010) Acesti indicatori ar putea fi grupati in indicatori ai metodei (ce vizeaza preponderent aspecte ale metodologiei stiintifice, greu de decelat de publicul necunoscator), respectiv indicatori de stil (ce vizeaza preponderent aspecte ideologice, mai usor de decelat de catre public, chiar fara cunostinte avansate de metodologia cercetarii) Figura 1 1 indicatori specifici ai pseudostiintelor Pentru a intelege mai bine semnificatia celor 12 indicatori amintiti mai sus, vom descrie succint ce semnifica fiecare dintre ei 1 3 1 Absenta procesului de falsificabilitate Conform lui Popper (1934 1981), la baza diferentei dintre stiinta si abordarile nestiintifice se afla incercarea omului de stiinta de a strange date empirice care sa-i invalideze ipotezele avute Demersul sau este, asadar, unul indirect, asemenea procesului de testare a ipotezelor, in care rezultatele nu se contorizeaza in termeni precum "ipoteza cercetarii se confirma", ci in aceia ca "ipoteza nula este respinsa, sprijinind astfel ipoteza cercetarii" Niciodata o teorie nu poate fi confirmata, ci doar sprijinita de datele empirice Pentru ca o teorie sau o abordare anume sa poata fi falsificabila este necesar (Stanovich, 2010): (a) sa existe instrumente care sa permita investigatia stiintifica (de exemplu, expresia "Dumnezeu este creatorul universului" poate fi adevarata sau falsa, dar atat timp cat metodele stiintifice actuale nu permit verificarea afirmatiei, nu se poate oferi un raspuns stiintific acceptabil deoarece lipsesc instrumente stiintifice care sa permita testarea ei; (b) sa fie suficient de specifica, incat sa permita falsificabilitatea enunturilor formulate (o teorie care poate explica orice sau care este prea vaga in formulare nu este considerata ca fiind stiintifica, deoarece nu se supune acestui criteriu al falsificabilitatii) De pilda, una dintre criticile aduse psihanalizei este aceea, ca desi teoria nu are capacitate predictiva specifica, cu alte cuvinte nu reuseste sa anticipeze evolutia unor comportamente, ea incearca sa explice orice post factum insa aceasta capacitate explicativa post factum (de exemplu, "autismul este o expresie a unei comunicari deficitare, reci, dintre mama-copil, a unui deficit de afectiune resimtit de catre copil ca venind din partea mamei", o teorie psihanalitica populara in secolul XX, dar nesustinuta stiintific de date) poate face mai mult rau si chiar stigmatiza anumite categorii de oameni De aceea, o teorie stiintifica buna nu este una care incearca sa explice orice, intr-o maniera rationalizatoare, post factum, ci una care face predictii specifice, anticipa evolutia unor comportamente, iar aceste predictii sunt sustinute de datele empirice colectate Caseta 1 1 Exemplu ipotetic de teorie pseudostiintifica Un cercetator formuleaza teoria transferului comportamentului agresiv parinte-copil prin intermediul mecanismului inconstient de identificare cu agresorul Conform acestei teorii, copiii preiau (invata) de la parintii lor modul agresiv de a raspunde la situatii frustrante, deoarece au observat ca un asemenea comportament poate aduce beneficii autorilor actului agresiv (de exemplu, obtin ceea ce isi doresc) Acest transfer se realizeaza intr-o maniera inconstienta, in cele mai multe situatii, cu exceptia cazului in care acest proces inconstient este blocat de un mecanism pulsional declansat de instinctul de afiliere al copilului, care inhiba orice manifestare de tip agresiv orientata catre semeni Acest gen de teorie poate explica post factum orice tip de scenariu, prin urmare nu permite testarea falsificabilitatii afirmatiilor Daca copilul nu se comporta agresiv, explicatia este ca instinctul de afiliere a blocat transferul agresivitatii Daca copilul se comporta agresiv, explicatia este o marturie a transferului inconstient de identificare cu agresorul Cu alte cuvinte, teoria poate fi utilizata pentru a explica orice, o caracteristica atractiva pentru consumatorii de psihologie cotidiana (pop), ce cauta semnificatii pentru originea comportamentului social, dar ineficienta din punct de vedere stiintific Apoi, chiar daca aceasta teorie ar fi permis verificarea unor predictii specifice (precum corelatia dintre nivelul agresivitatii dintre parinti si copii), ar fi fost nevoie de mai multe dovezi care sa sprijine specificitatea mecanismelor cauzale enuntate in teorie, precum transferul inconstient al comportamentului agresiv prin declansarea mecanismului de aparare - identificarea cu agresorul; existenta unui blocaj pulsional (sic!) determinat de constructul de tip umbrela - instinctul de afiliere etc 1 3 2 inversarea demersului de validare stiintifica in mod firesc ii revine cercetatorului care propune un anumit model sau o teorie sa stranga dovezi in favoarea conceptiei sale in cazul curentelor pseudostiintifice, acest aspect este inversat, solicitandu-li-se scepticilor sa ofere dovezi impotriva asertiunilor facute in teoria sau modelul respectiv Mai concret, de exemplu, nu este datoria celor care contesta asertiunea "efectele psihologice pozitive induse de practicarea meditatiei sunt cauzate de accesarea constiintei universale" sa demonstreze scepticismul lor prin dovezi Nici lipsa dovezilor, de ambele parti, nu poate fi interpretata ca un indicator al sustinerii teoriei accesului la "constiinta universala" prin meditatie, deoarece intr-o abordare stiintifica este sarcina celui care propune o anumita teorie sa ofere dovezi in sprijinul acesteia Caseta 1 2 Sofismul de tip ad ignoratium utilizat frecvent pentru a inversa demersul stiintific in cei zece ani de practica psihoterapeutica folosind noua tehnica de terapie dinamica sinergetica nu s-a publicat niciun studiu care sa demonstreze ca tehnica ar fi una ineficienta Prin urmare, aceasta forma de terapie este o tehnica valida de interventie psihoterapeutica 1 3 3 Biasul de confirmare si absenta revizuirilor O diferenta, sesizabila pe termen lung, intre teoriile stiintifice si cele pseudostiintifice consta in acceptarea revizuirilor teoretice specifica abordarilor stiintifice stiinta a fost deschisa mereu la corectii si adaptari ale teoriilor stipulate in acord cu datele obtinute in schimb, abordarile pseudostiintifice au suferit putine modificari de-a lungul timpului De exemplu, astrologia, ce-si propune sa faca predictii asupra evolutiei unei persoane in functie de pozitionarea exacta a astrelor la momentul nasterii, a ramas aproape neschimbata de 4 000 de ani, cu toate ca miscarea axei Pamantului in acest interval de timp a schimbat pozitia astrelor pe cer comparativ cu cea existenta cu patru milenii in urma) (Hines, 2003 apud Lilienfeld si Landfeld, 2008) Mai mult, pseudostiintele tind sa se raporteze in mod subiectiv la rezultatele eventualelor studii efectuate, acceptandu-le preferential doar pe acelea care le sunt convenabile, care sunt in acord cu teoria stipulata Daca rezultatele sustin teoria enuntata, pseudostiintele folosesc aceste date ca mijloace pentru advocacy-ul si marketingul teoriei respective Daca rezultatele nu sustin teoria enuntata, exista tendinta de a ignora (minimaliza) aceste rezultate si de a gasi tot felul de argumente (scuze) printre limitele metodologice ale studiului pentru a sustine in continuare teoria enuntata O asemenea tendinta este observata si printre abordarile stiintifice, insa in acest caz procesul de evaluare colegiala (peer-review) joaca rolul de a limita concluziile formulate, oricare ar fi acestea, tinand seama de limitele metodologice pe care le are orice demers stiintific 1 3 4 Accentul pe opinii si pe cazuri particulare in justitie, opiniile expertilor au o valoare insemnata in decizia pe care o ia judecatorul unui caz in stiinta, opiniile expertilor sunt irelevante daca nu sunt sustinute de date empirice provenite din studii riguroase din punct de vedere metodologic Stanovich (2010) remarca, cu umor, ca in medicina au fost formulate opinii favorabile atat din partea unor experti, cat si a unor beneficiari cu privire la valoarea curativa a dintilor de porc, a excrementelor de crocodil, a prafului de pe mumiile egiptene si a multor alte remedii trasnite Nici "intelepciunea populara" romaneasca nu ramane restanta la nivel imaginativ cand este vorba de remedii curative naturiste pentru tot felul de probleme medicale sau psihologice in toate aceste cazuri, tratamentele nu pot distinge, pe baza unei simple marturii, fie ea televizata si sincera, daca efectul produs de acestea este unul real sau unul determinat de efectul placebo Am putea afirma ca intreaga istorie a medicinei, inainte de secolul XX este doar o istorie a efectului placebo (Postman, 1986) Dar vindecarea nu este doar dependenta de cauza sugerata sau de efectul placebo Pot aparea alte situatii precum existenta unor variabile confundate, regresia catre medie, remisia spontana, maturarea, evolutia ciclica a tulburarii etc Toate acestea pot conduce la o evolutie favorabila a unei tulburari (deficiente) Studiile de caz prezinta aceleasi neajunsuri Ele pot fi utile la nivel stiintific pentru generarea de ipoteze, dar nu si pentru sustinerea (confirmarea) acestora Opiniile expertilor, bazate sau nu pe anumite studii de caz, reprezinta primul pas intr-un demers stiintific, ce trebuie completat (verificat) prin realizarea de studii empirice Pseudostiintele ignora acest pas esential, preferand utilizarea marturiilor expertilor si a datelor provenite din unele studii de caz, pe care le prezinta drept dovezi stiintifice de netagaduit, despre eficienta unei interventii anume 1 3 5 Extinderea fara temei a concluziilor Orice program educational de metodologia cercetarii subliniaza ideea ca rezultatele stiintifice trebuie privite in termenii limitelor pe care le-a avut studiul respectiv ideea validitatii concluziilor extrase pe baza rezultatele obtinute intr-o anumita cercetare este centrala pentru orice abordare stiintifica, de aceea ea a fost abordata si dezvoltata pe larg in mai multe sectiuni ale acestei lucrari Pseudostiintele nu sunt preocupate de acest aspect Dimpotriva, ele tind sa nu diferentieze, de pilda, intre studii bazate pe surprinderea mecanismelor schimbarii si studii de tip efficacy sau effectiveness (vezi tabelul 4 4) De asemenea, pentru pseudostiinte are putina relevanta daca studiul este unul experimental sau unul non-experimental Prin urmare, nu ar fi exclus sa constatam ca autorii unui simplu studiu comparativ non-experimental ce urmarea relatia dintre muzica de relaxare si nivelul anxietatii de stare, sa ajunga la concluzii extravagante, tipice unui demers pseudostiintific, precum cel prezentat in caseta 1 3 Caseta 1 3 Exemplu de extindere neintemeiata a concluziilor Diferentele semnificative statistic inregistrate intre cei care au urmat si cei care nu au urmat sedinte de meloterapie, indica un nivel mai scazut al anxietatii in cazul primului grup Acest lucru imbucurator este cauzat de fenomenul de rezonanta ce apare intre compozitia vibratorie speciala a muzicii si mintea celui care o asculta, inducand ascultatorului o stare psihica speciala, de liniste si armonie interioara Muzica, ne pune asadar, in rezonanta cu energii benefice din macrocosmos, influentand benefic atat starea fizica, cat si pe cea psihica 1 3 6 Evitarea procesului de peer-review Publicul tinde sa se increada mai mult intr-o anumita teorie daca aceasta a fost publicata in reviste de specialitate Pentru aceasta, stiinta apeleaza la procesul de evaluare colegiala, cunoscut sub denumirea generica din limba engleza de peer-review Cu toate ca nu este un mecanism perfect, acest proces este menit tocmai pentru a elimina de la publicare acele articole care au deficiente metodologice majore si sau care prezinta concluzii eronate, ce nu sunt sustinute de datele empirice colectate in cele mai multe cazuri, pseudostiintele ocolesc acest proces, promovandu-si produsele direct, prin mijloace specifice marketingului comercial Pentru a-si justifica aceasta decizie, promotorii pseudostiintelor acuza revistele de specialitate ca promoveaza ortodoxismul stiintific, ca dau dovada de conservatorism si de rigiditate in politica editoriala Aceasta pozitie de "victima" poate fi augmentata de enumerarea unor cazuri celebre de erori comise prin procesul de peer-review, conform carora conceptele prea inovative pentru timpul in care au fost dezvoltate sunt privite cu circumspectie de catre comunitatea stiintifica, la fel cum s-a intamplat si in cazul teoriei relativitatii a lui Einstein 1 3 7 Sprijin pentru holism Un mecanism de autoaparare prezent in cadrul multor pseudostiinte este apelul la complexitatea sistemului psihologic Atunci cand teoriile sau enunturile facute nu corespund cu datele empirice colectate, auzim mereu explicatii de genul: lucrurile sunt mult mai complexe si nu trebuie privite izolat (Lilienfeld et al , 2004) Fie ca este vorba de interpretarea unui element dintr-un test proiectiv (care mereu trebuie privit in mod contextualizat, coroborat cu informatiile din anamneza pacientului, pentru a confirma presupozitiile avute -n a ) sau ca este vorba despre rezultatele unui studiu privind eficienta unei tehnici de meditatie asupra dezvoltarii personale, prin apelul la holism avem acelasi tip de discurs Daca datele observate confirma presupozitiile avute, inseamna ca tehnica proiectiva sau meditatia respectiva sunt tehnici valoroase Daca datele observate infirma asteptarile avute, inseamna doar ca "informatiile oferite de testele proiective trebuie interpretate contextual si dinamic, niciodata izolat de istoricul pacientului si de dinamica elementelor din structura proiectiva analizata", respectiv ca "beneficiile meditatiei au fost deja demonstrate stiintific, doar ca, in acest caz, o serie de limite prezente in studiul realizat au afectat posibilitatea de a surprinde eficienta acestei metode terapeutice" Holismul primeste chiar o coloratura spirituala in multe dintre pseudostiintele apartinand medicinei alternative in multe dintre aceste stiinte exista trei idei de baza: (a) functionarea normala a energiei vitale asigura o stare de sanatate; (b) blocajul fluxului de energie conduce la o serie de afectiuni; (c) deblocarea fluxului de energie vitala va restabili starea de sanatate (Bayerstein, 1996) De pilda, in acupunctura, acele sunt folosite pentru a debloca anumite canale energetice (meridiane) Daca utilizarea tehnicii are efect este o dovada a faptului ca s-ar fi reusit deblocarea canalelor energetice, astfel incat fluxul vital sa functioneze in schimb, daca utilizarea tehnicii nu are eficienta scontata, semnifica faptul ca problema este mult mai serioasa, ca blocajul energetic este unul puternic, necesitand un timp si un efort indelungat pentru deblocare Se observa, asadar, ca in spatele acestui indemn la o abordare holista se regaseste aceeasi problema a lipsei falsificabilitatii, aceasta fiind principala caracteristica distinctiva intre stiinta si pseudostiinta 1 3 8 Sofismul ad antiquitatem Acest sofism porneste de la ideea gresita ca, daca o idee a reusit sa supravietuiasca un interval lung de timp, fara a fi abandonata, insemna ca este o idee valoroasa "Vechii invatati chinezi", "intelepciunea pierduta a vechilor civilizatii" sunt numai cateva dintre formularile care incearca sa adauge forta unor argumente prezentate, prin rezistenta acestora in timp Abordarea New Age a incercat sa gaseasca similaritati intre scrierile de filosofie orientala antice si descoperirile recente din fizica cuantica insa, asa cum remarca Bayerstein (1996) interpretarea libera a acestor similitudini se bazeaza pe acelasi gen de speculatii precum cele intalnite in cautarea de similitudini dintre scrierile lui Nostradamus si evenimentele petrecute de-a lungul timpului, pornind de la inclinatia naturala a individului de a cauta semnificatii pentru un anumit eveniment petrecut mai mult decat ar fi cazul (Hyman, 1977) Caseta 1 4 ilustrarea cumulativa a unor elemente descriptive specifice pseudostiintelor (adaptare dupa Marin, 2009) Eneagrama este un instrument psihologic foarte performant cu originea in intelepciunea antica ce descrie noua stiluri sau tipuri de personalitate, de fapt noua stiluri diferite de a ne trai viata Ce are unic eneagrama este faptul ca este singurul sistem psihospiritual care descrie personalitatea umana in totalitatea ei, ca un continuum de stari si niveluri de constiinta, dezvaluind misterul starilor contradictorii pe care le traim Este o sinteza a celor mai noi teorii psihologice: teoria personalitatii multidimensionale, teoria relatiei cu obiectul, teoria actualizarii sinelui, dar si a vechilor traditii esoterice Chiar simbolul eneagramei se crede ca este un simbol de origine pitagoreica datorita proprietatilor sale matematice speciale 1 3 9 Asertiuni generale si sau exagerate Tehnicile propuse de o buna parte dintre curentele ezoterice sau dintre abordarile pseudostiintifice nu sunt unele oarecare, ci unele care neaparat aduc "o schimbare profunda in viata ta, o provocare enorma, vor revolutiona sistemul tau de valori si te vor ajuta sa fii cu adevarat liber" De exemplu, terapia campului gandirii propusa de Callahan (2001) este o forma de psihoterapie considerata a fi pseudostiintifica, conform careia gandurile si experientele traite se transforma intr-un camp al gandirii, in cadrul caruia orice deformare semnifica o problema emotionala Pentru a inlatura problemele noastre emotionale e nevoie sa indreptam deformarea campului gandirii, iar acest lucru se poate face prin mijloace tactile, daca se apasa asupra anumitor meridiane energetice pentru a restabili echilibrul lui chi (qi - energia vitala in cultura traditionala chineza) Pe langa problematica in sine, legata de teoria ezoterica aflata la baza acestei forme de psihoterapie, exista si pretentia sustinatorilor ei ca interventia este utila pentru orice fel de tulburare psihopatologica, ea putand fi aplicata nu numai la adulti, ci si la copii sau animale insa nu toate abordarile pseudostiintifice se rezuma la a oferi asertiuni extravagante Dimpotriva, unele abunda de asertiuni general valabile sau de asertiuni aparent valide in aceasta categorie intra abordarile care apeleaza frecvent la un discurs bazat pe efectul Barnum (asertiuni general valabile, dar lipsite de valoare predictiva la nivel individual) (Forer, 1949 apud Pelham si Blanton, 2007) De pilda, daca cineva va prezinta rezultatele unui test psihologic, conform carora aflati ca "sunteti o persoana care se simte bine atunci cand sunteti apreciata de catre ceilalti, ca uneori aveti tendinta de a fi mai critic(a) cu dvs , ca va frustreaza incercarile celorlalti de a va impune anumite limite sau restrictii, ca preferati un anumit grad de schimbare in viata dvs , dar fara a renunta la valorile si principiile care va definesc ca persoana", veti afirma, foarte probabil, ca instrumentul utilizat surprinde corect descrierea modului dvs de a fi Problema acestui gen de afirmatii este ca este general valabil, prin urmare nefalsificabil, deci neinclus intr-o abordare stiintifica in psihologie Acest tip de afirmatii general valabile conduce adeseori la proliferarea unui discurs stiintific de tipul "bunului-simt", la care recurg multi specialisti in incercarea lor de a oferi interpretari sau explicatii pentru evenimente fenomene psihologice pe care nu le cunosc foarte bine Astfel, revolta tinerilor este mereu un rezultat al nevoii lor nesatisfacute de a fi tratati de la egal la egal, ca niste adulti, iar problemele emotionale ale copiilor avand parintii plecati la munca in strainatate au drept sursa deficitul de afectiune cu care ei se confrunta etc O categorie speciala de interpretari specifice simtului comun este apelul la semnificatia simbolica in Antichitate, Aristotel argumenta ca gravitatia reflecta dorinta obiectelor de a se intoarce catre pamantul-sursa, la locul de care apartin (Rensberger, 1986 apud Pelham si Blanton, 2007) Desigur, fizica a avansat mult si a renuntat la acest gen de explicatii de sorginte animista Nu acelasi lucru se poate spune despre psihologie, care se confrunta inca cu acest gen de interpretari simbolice, chiar daca nu de sorginte animista De pilda, in grafologie, un scris mic si inghesuit poate fi un semn al reticentei sau zgarceniei persoanei respective, in timp ce un scris neingrijit, cu multe erori, reflecta stilul expansiv si impulsiv de a actiona in alte domenii, cum ar fi comunicarea nonverbala, pozitia unui individ cu bratele incrucisate indica opozitia si reticenta acestuia fata de mesajul transmis, in timp ce unele teorii psihanalitice considera actele de gelozie nimic altceva decat o expresie a neincrederii in capacitatea propriei persoane de a ramane fidel(a) fata de partenerul sau La prima vedere, interpretarile pot parea plauzibile, insa ele sufera puternic in ceea ce priveste validitatea lor empirica, predictiva 1 3 10 Abuzul de limbaj tehnic (specializat) in incercarea de a se apropia cat mai mult de abordarile stiintifice, unele tehnici pseudostiintifice au imprumutat limbajul si discursul stiintific pentru a-si expune teoria De pilda, Herbert et al (2000; vezi caseta 1 5 mai jos) prezinta modul in care autorii unei alte forme de psihoterapie considerata ca fiind pseudostiintifica - EMDR ( Eye Movement Desensitization and Reprocessing) isi prezinta modelul procesarii accelerate a informatiei ca baza teoretica a interventiei intr-o maniera ce pare credibila Asadar, este doar un stereotip faptul ca pseudostiintele ar respecta patternul holismului si al caderii in admiratie pentru filosofia orientala antica Ele pot disimula foarte bine, utilizand un discurs stiintific elevat De notorietate ramane farsa jucata de fizicianul Sokal care a reusit sa publice un text fara sens in revista postmodernista Social text, primind acceptul evaluatorilor de a publica articolul cu titlul original "Transgressing the Boundaries: Towards a Transformative Hermeneutics of Quantum Gravity", din cadrul caruia este prezentat un mic pasaj ca nota de subsol, pastrand varianta originala a textului, in limba engleza , reluat de Lilienfeld si Landfield (2008, p 1225) Caseta 1 5 Exemplu de abuz in utilizarea unui limbaj tehnic (Herbert et al , 2000, p 960) "Receptorii neuronali (potentialul sinaptic) inclusi in retelele neuronale respective contin niveluri diferite ale pragurilor de activare, denumite de la A la Z, in functie de valoarea adaptiva a informatiei encodate Se presupune ca retelele neuronale tinta Z au valori prea ridicate ale pragurilor de activare, ceea ce conduce la imposibilitatea conectarii acestor retele la alte retele ce contin informatii cu valoare adaptiva Cele din urma pot fi activate mai usor, datorita valorii scazute a pragurilor de activare Astfel, potentialul sinaptic este diferit, pentru fiecare tip de afect encodat in diferite retele neuronale (pragurile de activare fiind cele mai ridicate pentru acele retele neuronale care encodeaza trairile afective asociate evenimentului traumatic - n a ) Prin intermediul EMDR, pragul de activare a receptorilor neuronali din retele scade, putandu-se stabili conexiuni cu alte retele ce contin informatie adaptiva, ale caror prag de activare neuronala este mai scazut' 1 3 11 ideea evolutiei superioritatii adeptilor Abordarea stiintifica nu contine in discursul sau referiri de ordin calitativ cu referire la adeptii uneia sau alteia dintre teoriile stiintifice Unele pseudostiinte tind sa faca o asemenea diferenta intre cei care imbratiseaza teoriile lor si cei care nu cred in aceste idei Primii sunt cei care se considera "evoluati spiritual", "deschisi spre adevar si spre a surprinde esenta Universului", "pregatiti pentru progres" "integrati spiritual pe calea cunoasterii sinelui profund, dincolo de orice iluzie a lumii materiale" Ceilalti se afla inca la un nivel "inferior", "nepregatiti sa faca pasul spre progresul spiritual", "prea rigizi si dogmatici, reductionisti", "incapabili sa sesizeze complexitatea universului si legaturile ascunse, esentele ultime" 1 3 12 Absenta conexiunilor cu teoriile anterioare si cu celelalte stiinte in abordarea stiintifica, discursul se construieste pas cu pas, pornind de la teoriile deja existente, aducandu-li-se acestora corectii, completari sau noi perspective pe baza unei analize critice Aceasta deoarece pentru a fi considerata ca un progres in cunoastere, o teorie ar trebui sa explice nu numai aspectele noi, ci sa analizeze (integreze) modelele mai vechi din prisma noii teorii in multe dintre abordarile pseudostiintifice lipseste aceasta conexiune cu teoriile anterioare Apare in schimb ideea ca abordarea este una revolutionara, ce necesita noi paradigme asupra realitatii Chiar daca asemenea situatii au aparut rar si in domeniul stiintific (vezi trecerea la teoria relativitatii a lui Einstein), ele apar mult mai frecvent ca asertiuni in justificarea unor constructii teoretice din domeniul pseudostiintelor in plus, un atu important al unei teorii stiintifice este nu numai conexiunea cu teorii anterioare din domeniu, ci si conexiuni dovedite stiintific cu alte stiinte in acest sens teoria szondiana a genelor pulsiunilor si a destinului este vetusta daca ne raportam la rezultatele obtinute din cercetarile genetice, lipsind fundamentarea biologica pentru o asemenea teorie Asadar, in pofida dezvoltarii extraordinare a interesului pentru psihologie, este nevoie de multa atentie din partea comunitatii stiintifice psihologice de a nu cadea prada abordarilor de tip pseudostiintific Nevoia societatii contemporane de a gasi explicatii psihologizante pentru o serie de evenimente si situatii cu care se confrunta avantajeaza, paradoxal, abordarile de tip pseudostiintific, indeosebi ca urmare a catorva dintre caracteristicile acestora: (a) oferirea de explicatii post eveniment prin intermediul unor teorii nefalsificabile; (b) mantaua holismului si a legaturii cu spiritualitatea; (c) accentul pus pe confirmare prin apelul la opinii si cazuri particulare, ce sunt mult mai usor de obtinut decat dovezile experimentale 1 4 Consecinte negative ale abordarii pseudostiintifice in psihologie Riscurile derivate din popularitatea curentelor pseudostiintifice printre consumatorii de psihologie sunt cu atat mai mari, cu cat in alte domenii apare o presiune inversa, de fundamentare stiintifica a oricarei practici profesionale, cel mai ilustrativ exemplu fiind abordarea validarii stiintifice venita dinspre medicina (evidence based medicine - EBM) Astfel, un prim risc major ce apare in absenta unei abordari stiintifice in psihologie este unul de ordin financiar De pilda, serviciile psihologice din zona asistentei medicale se afla in competitie pentru fonduri cu alte domenii din sfera asistentei medicale, inclusiv farmacoterapia Din acest punct de vedere, nevoia de servicii psihologice validate stiintific este una acuta de vreme ce, desi cheltuielile, in termeni procentuali, pentru servicii de sanatate mentala au ramas aproximativ constante in ultimii 30 de ani, dinamica costurilor in interiorul acestor servicii a suferit modificari semnificative Astfel, costurile alocate pentru farmacoterapie au crescut, in timp ce cheltuielile pentru servicii de psihoterapie au scazut, daca ne raportam in termeni procentuali (APA Task Force, 2009), iar acest aspect constituie un semnal de alarma mai cu seama ca numarul de psihologi a crescut de patru ori in ultimii 50 de ani (Goodheart, 2010) Aspectul principal care a condus la aceasta stare de fapt a fost acela ca, in lipsa unor resurse financiare suficiente, casele de asigurari au inceput sa plateasca doar acele servicii pentru care exista dovezi de validitate stiintifica Cum domeniul farmacoterapiei a imbratisat inaintea psihoterapiei ideea unei abordari bazata pe validarea stiintifica, constatam o crestere a acestui tip de cheltuieli in dauna psihoterapiei, in cadrul categoriei de cheltuieli privind sanatatea mentala in stransa legatura cu acest aspect, apare ideea cresterii responsabilitatii profesionale (accountability) in domeniul evaluarilor si interventiilor psihologice in alte domenii din sfera sanatatii mentale, o consecinta importanta a abordarii bazate pe validarea stiintifica a fost aceea a standardizarii interventiilor prin dezvoltarea unor protocoale (proceduri standard de lucru) Acest aspect a permis tragerea la raspundere a celor care nu respectau metodologia de lucru, un aspect important atat pentru companiile de asigurari, cat si pentru casele de sanatate, in demersul lor de a deconta serviciile prestate Numai o abordare bazata pe validare stiintifica va putea dezvolta, in timp, protocoale standard de interventie in cadrul psihologiei si al psihoterapiei, care sa permita evaluarea respectarii responsabilitatii profesionale a specialistilor din psihologie si psihoterapie Un al treilea risc pe care il presupune o abordare de tip pseudostiintific in sfera psihologiei este acela al izolarii si marginalizarii domeniului, cel putin in sfera serviciilor de sanatate mentala in contextul in care se tinde catre oferirea de servicii integrate de sanatate mentala (APA Task Force, 2009; Spring, 2007) si in care celelalte servicii din sfera medicala sunt fundamentate stiintific (psihiatria, farmacoterapia, asistenta medicala - nursing), este necesar ca si interventiile de tip psihologic sa fie validate empiric, pentru a putea fi incluse in acest pachet integrat de servicii de sanatate mentala Acestor riscuri li se adauga cel al perceptiei distorsionate a domeniului psihologiei, in contextul in care multi dintre absolventii de psihologie nu tin cont in alegerea formarii lor profesionale continue de perspectiva bazata pe validare stiintifica in urmatorul capitol al acestei parti introductive sunt prezentate in detaliu caracteristicile unei practici validate stiintific in domeniul psihologiei Vom observa, cat de putine dintre elementele prezentate acolo sunt incluse in practica uzuala a specialistilor din psihologie si psihoterapie Din nefericire, discursul majoritatii psihologilor, cel putin din Romania, constituie inca un amalgam format din clisee lingvistice bazate pe simtul comun ("copiii trebuie ajutati sa-si dezvolte increderea in fortele proprii") si din opinii nevalidate empiric, preluate intr-o maniera scolastica, pe parcursul formarii profesionale continue ("deoarece, asa cum afirma Freud, pulsiunile sexuale constituie motorul comportamentului uman") 1 5 Descriptori ai unei abordari stiintifice Un element extrem de important de retinut este acela ca nu continutul studiat este cel care determina diferenta dintre stiinta si pseudostiinta De pilda, nu faptul ca cineva decide sa studieze fenomenele extrasenzoriale (premonitii, precognitii), adica subiecte contradictorii pentru lumea stiintifica, determina caracterul stiintific sau pseudostiintific al acestui demers Ceea ce constituie diferenta este apelul la metoda stiintifica Daca studiile efectuate utilizeaza o metoda stiintifica si trec cu succes prin mecanismul de peer-review in cadrul unor reviste relevante pentru un anumit domeniu studiat, putem considera un asemenea demers ca fiind unul stiintific (vezi, de exemplu, studiul lui Bem (2011) despre precognitii si premonitii publicat in prestigioasa revista Journal of Personality and Social Psychology) in schimb, daca studiile sunt caracterizate mai degraba de indicatori specifici abordarii pseudostiintifice, inclusiv acela de evitare a procesul de peer-review sau de simulare a acestuia in cadrul unor reviste marginale, de "cas(t)a", putem vorbi despre un demers pseudostiintific in buna masura, indicatorii unui demers stiintific, pot fi identificati ca opusul celor specifici pseudostiintelor Astfel, abordarea stiintifica se bazeaza ca mecanism de functionare pe principiul falsificabilitatii, pe evitarea biasului de confirmare, pe existenta revizuirilor teoretice etc Stanovich (2010) surprinde patru caracteristici definitorii pentru orice demers stiintific prezentate, pe larg, in cele ce urmeaza La acestea as adauga o alta caracteristica esentiala, aceea de a adopta o atitudine sceptica fata de rezultatele obtinute in orice studiu, oferind o insemnatate deosebita explicatiilor alternative Figura 1 2 Caracteristici definitorii ale unui demers stiintific 1 5 1 Empirismul sistematic Oamenii manifesta psihologic inclinatia de a face predictii sau de a oferi explicatii si interpretari pentru evenimentele din viata lor insa, in acest demers ei apeleaza rar la un demers stiintific, bazat pe ceea ce se numeste empirism sistematic (Gravetter si Forzano, 2009; Stanovich, 2010) in schimb, ei isi bazeaza explicatiile pe credinte populare (de exemplu, "sa nu stai pe coltul mesei pentru ca nu te vei casatori") sau pe intuitii personale rezultate in urma experientei personale care le creeaza senzatia ca au dreptate (de exemplu, o femeie gravida care afirma: "sunt convinsa ca voi naste o fetita pentru ca simt sarcina diferit fata de prima data cand am nascut un baiat") Este evident faptul ca asemenea elemente nu pot face parte dintr-o abordare de tip stiintific O alta sursa care sta la baza modului lor de cunoastere si interpretare a lumii se refera la apelul la autoritate, fie aceasta una de ordin stiintific, filosofic sau religios in aceasta categorie intra informatiile furnizate de expertii dintr-un domeniu Cu toate ca metoda este deosebit de economica in ceea ce priveste consumul de timp sau de alte resurse, exista un risc ridicat ca unele dintre aceste opinii sa fie eronate De aceea, apelul la autoritate nu este considerat un element acceptabil din perspectiva unui demers stiintific, indiferent de prestigiul si credibilitatea celui care a emis o anumita afirmatie Acest lucru se intampla pentru ca aceste opinii pot fi distorsionate (sau chiar eronate din punct de vedere stiintific, cum ar fi cazul explicatiei deficitului de afectivitate matern ca o cauza pentru aparitia autismului emisa de psihanalistul Bruno Betellheim [Wikipedia, 2009]) Mai mult, presiunile exercitate de grupurile de advocacy cresc riscul emiterii unor opinii distorsionate care sa sustina o cauza sau alta, in functie de interesul grupului de suport (de exemplu, vezi opiniile pro sau impotriva adoptiei internationale sau cele ale adoptiilor de catre familii cupluri de acelasi sex) Nu in ultimul rand, un alt neajuns al fundamentarii cunoasterii pe deciziile unor experti este acela al confuziei domeniului de expertiza Sa ne intelegem, doar pentru ca o persoana a avut contributii importante intr-un domeniu, nu inseamna ca mereu are dreptate Wundt, intemeietorul psihologiei stiintifice prin intermediul laboratorului de la Leipzig, nominalizat de doua ori pentru acordarea premiului Nobel pentru medicina (Academia Premiilor Nobel, 2012), se declara impotriva votului universal ("Franta si-a sapat mormantul prin reforma votului universal", Wundt, 1866 apud Bringmann, Ungerer si Bringmann, 1995, p 239) Tot el scria materiale de propaganda antiamericane si antibritanice in Primul Razboi Mondial (New World Encyclopedia, 2008) in mod similar, numerosi intelectuali romani apreciati, inclusiv in zilele noastre, au facut parte din ceea ce Eugen lonescu denumea plastic fenomenul de rinocerizare a intelectualilor (apud Morar, 2005) Mircea Eliade a imbratisat si sustinut legionarismul, Mihai Eminescu, Nicolae lorga, Constantin Noica sau Emil Cioran au scris numeroase texte cu continut antisemit, iar ultimul a mers chiar mai departe, aducand elogii lui Hitler si lui Mussolini, precum si ideii de stat totalitar (de exemplu, "Nu exista om politic in lumea de astazi, care sa-mi inspire o simpatie si o admiratie mai mare decat Hitler", in Vremea nr 346, din 15 iulie 1934 apud Morar, 2005) De aceea este deosebit de important sa retinem ca, din punct de vedere stiintific, valoarea unei idei sau opinii nu este judecata dupa CV-ul celui care o enunta si nici nu se transfera automat cu valoarea intelectuala a enuntatorului, desi exista inclinatia retorica, intalnita in cazul unora, de a-si afisa toate titlurile si distinctiile obtinute, inainte de a exprima o opinie, pentru a da un plus de greutate acesteia Mai mult, opiniile nu devin valide stiintific doar bazandu-se pe prestigiul enuntatorului, chiar daca ele vizeaza probleme din cadrul domeniului de expertiza al acestuia in acest sens, destul de cunoscuta este afirmatia eronata facuta de catre Einstein, in 1932, cand afirma ca sunt putine indicii care sa arate ca se va putea obtine vreodata energie nucleara O alta sursa majora de cunoastere este apelul la rationamentele logice Desigur, daca premisele sunt adevarate si daca rationamentul este unul corect din punct de vedere logic, cu siguranta concluzia este una adevarata Din pacate, in realitate asistam de multe ori la formularea de rationamente pornind de la una sau mai multe premise eronate sau esuam in a identifica greseli in modul de constituire a silogismelor Una dintre cele mai intalnite erori privind rationamentele in domeniul stiintific este sofismul afirmarii consecintei Daca X, atunci Y Y Deci, X Transpus in termeni stiintifici acest gen de rationament devine: Daca teoria X este adevarata, atunci vom anticipa ca obtinem Y; obtinem Y; deci, teoria X este adevarata Acest rationament este unul gresit deoarece Y poate fi explicat, probabil, prin alte teorii alternative in exemplul: (a) "daca a plouat recent, pamantul este umed"; (b) "pamantul este umed"; (c) "deci, a plouat recent" putem gasi si alte explicatii pentru care pamantul ar fi umed (cum ar fi aceea de a fi fost stropit de catre un gradinar) in schimb, rationamentul ar fi unul corect daca ar lua o alta forma logica, cum ar fi negarea consecintei, precum in exemplul: (a) "daca ploua recent pamantul este umed"; (b) "pamantul nu este umed"; (c) "deci, nu a plouat recent" Daca X, atunci Y Non Y Deci, non X Transpus in logica stiintifica, rationamentul corect este: Daca teoria X este adevarata, atunci vom anticipa ca vom obtine Y; nu obtinem Y; deci, teoria X nu este adevarata Pentru a complica si mai mult lucrurile, chiar asemenea argumente construite corect pot ajunge in practica la concluzii gresite deoarece se pot strecura alte erori, de ordin metodologic, care sa inhibe aparitia efectului Y in practica putem observa ca pamantul nu este umed, chiar daca a plouat recent, daca pamantul avut sub observatie este asezat sub o copertina in mod similar, in studii de specialitate se pot strecura erori de ordin metodologic, care conduc la rezultate distorsionate in aceste conditii nu inseamna neaparat ca teoria din spatele studiului este una gresita, ci este posibil ca anumite artefacte metodologice sa conduca la esecul observarii efectului in plus, capacitatea de a rationa corect, esentiala pentru a ajunge la concluzii adevarate, este afectata in cazul multora dintre oameni, care se lasa inselati de aparente De exemplu, 67% dintre studentii de masterat chestionati recent au afirmat ca rationamentul prezentat in partea stanga a casetei 1 6 ar fi unul corect, in timp ce niciunul dintre masteranzi nu a considerat rationamentul din partea dreapta a aceleasi casete ca fiind unul corect, desi ambele au aceeasi structura conform logicii propozitionale Solutia formala la acest gen de rationamente poate fi oferita doar prin apelul la logica predicatelor Toti X sunt M Unii M sunt Y Unii X sunt Y Caseta 1 6 Exemplu de rationament, identic propozitional, care duce la concluzii diferite Toate femeile sunt fiinte umane Toate femeile sunt fiinte umane Unele fiinte umane sunt psihologi Unele fiinte umane sunt barbati Deci, unele femei sunt psihologi Deci, unele femei sunt barbati O ultima sursa importanta de cunoastere este metoda empirica, bazata pe ideea de a colecta date despre situatia existenta prin simpla observatie Astfel, putem cunoaste, de exemplu, ca fiinta umana are patru membre, doua inferioare si doua superioare; ca iarna nu este la fel de cald ca vara; ca exista un ciclu periodic al anotimpurilor etc Dar apelul exclusiv la observatii si date empirice, poate fi iluzoriu, aproape 50% dintre romani cred ca Soarele se invarte in jurul Pamantului si nu invers (Vlasceanu, Dusa si Rughinis, 2010), iar un numar din ce in mai insemnat de copii cred ca vacile au culoarea mov, preluand reprezentarea din celebra marca de ciocolata (FDSC, 2010) Nu in ultimul rand, aceste observatii empirice pot fi obiectul unor interpretari eronate, bazate pe credintele, asteptarile si cunostintele anterioare ale celui care face observatia, ceea ce constituie o alta limita a cunoasterii bazate exclusiv pe metoda empirica Ca urmare, toate sursele de informatii prezentate anterior, fie ca este vorba de intuitii sau credinte populare, de opinii ale unor autoritati stiintifice sau religioase, de demersuri rationale, logice sau de colectarea de date empirice, au o serie de limite care pot conduce la distorsionarea cunoasterii Niciuna dintre ele nu se suprapune cu empirismul sistematic intalnit intr-o abordare stiintifica a cunoasterii insa ambii termeni continuti in acest construct de empirism sistematic sunt definitorii Astfel, empirismul indica predispozitia unui demers stiintific de a colecta date din realitate (empirism), cu precizarea ca acest demers este unul sistematic (controlat, structurat), orientat spre testarea unei teorii Prin controlul efectuat asupra metodelor empirice de colectare a datelor se doreste evitarea erorilor care ar conduce la obtinerea de date distorsionate despre realitate, iar prin caracterul structurat si logic al acestui demers se are in vedere realizarea masuratorilor (observatiilor) intr-un context specific, al testarii unor teorii sau a unor modele, care sa permita ulterior realizarea de inferente (predictii, explicatii) despre modul de functionare a realitatii, dincolo de ceea ce este imediat si direct observabil, masurabil Prin urmare, empirismul sistematic nu se rezuma la simpla observare a realitatii, la a colecta date, ci are in vedere un demers sistematic de verificare a unei teorii (ipoteze, predictii) De aceea, cea mai mare parte dintre studiile realizate contin cel putin o ipoteza ce trebuie cercetata si o teorie pe care aceasta se bazeaza (testarea unei teorii nefiind altceva decat demersul de generare si de testare a unui set de ipoteze corelate, ce deriva din teoria respectiva) De aceea, prin empirism sistematic (vezi, spre ilustrare, caseta 1 7), vom intelege un demers complex ce cuprinde: (a) observarea realitatii prin prisma unei teorii (lentile de descifrare a realitatii); (b) generarea unei ipoteze cu scopul de a verifica realitatea observata; (c) testarea ipotezei printr-un demers investigativ adecvat; (d) finalizarea demersului printr-un raspuns care poate sprijini sau nu teoria formulata, intr-o maniera indirecta, prin intermediul ipotezei generate din teoria respectiva Un lucru foarte important legat de acest demers sistematic empiric este faptul ca niciodata in stiinta nu este corect sa utilizam expresii de genul "ipoteza este confirmata", "teoria este dovedita (a fost demonstrata)", ci doar expresii de tipul "ipoteza este sustinuta", "teoria este sprijinita de datele empirice colectate" Acest lucru se intampla pentru a evita sofismul afirmarii consecintei prezentat anterior Astfel, un rezultat stiintific conform caruia frecventa mai ridicata a viselor cu continut violent intalnita in cazul baietilor, comparativ cu cel al fetelor, poate fi interpretat diferit, atat ca un sprijin in favoarea teoriei psihanalitice a complexului lui Oedip (teama baietilor de a fi castrati de tatal lor ca urmare a dragostei lor pentru mama), cat si ca o consecinta a unor diferente de gen existente la nivel genetic (Coolican, 2004) Pe scurt, prin acest demers empiric sistematic, stiinta avanseaza prin formularea de teorii explicative pentru anumite fenomene observate, pe baza carora se pot face o serie de predictii a caror valoare de adevar este testata prin demersul stiintific realizat in functie de rezultatele obtinute se poate ajunge, fie la sprijin pentru teoria respectiva si la identificarea unor legitati cu valabilitate larga, fie, dimpotriva, la revizuirea teoriei respective, pentru a putea include rezultatele obtinute sau chiar la eliminarea teoriei respective, in cazul in care noile date obtinute nu pot fi explicate nici macar de o varianta revizuita a teoriei respective Caseta 1 7 Pasii unui demers empiric sistematic ilustrarea unor cazuri ipotetice de studiu Pasii de lucru Exemplul 1 Exemplul 2 Pasul 1 in ultimele luni de zile am Se constata adesea, ca multi dintre indivizii care renunta la Observarea crescut in greutate Am locul lor de munca actual fac parte dintre cei care percep realitatii observat, in aceeasi perioada, munca depusa ca fiind una extrem de solicitanta (lucreaza prin prisma ca am renuntat sa mai practic mult, greu, in conditii de stres), fiindu-le greu sa faca fata unei teorii orice activitate fizica intensa cerintelor postului Din perspectiva teoretica, posturile (asociere pe baza de inductie) solicitante sunt cele in care se intensifica riscul de a Este foarte probabil ca dezvolta probleme de sanatate fizica si mentala printre surplusul de calorii angajati, mai cu seama de catre angajatii care dispun de neconsumate sa fie cauza resurse putine cresterii in greutate (deductie pe baza teoretica - cunostinte anterioare din domeniul nutritiei) Generarea ipotezei de 1 lucru Demararea unui program de intentia unui individ de a parasi actualul loc de munca se activitati fizice va afla in legatura cu nivelul de solicitare resimtit fata de reduce elimina tendinta de a postul pe care il ocupa Un nivel ridicat de solicitare creste in greutate (comparatie resimtit pe post este asociat cu un risc mai ridicat al intre situatia greutatii mele in fluctuatiei de personal lunile in care nu am facut sport vs lunile in care am facut miscare fizica intensa) Testarea ipotezei de lucru in conditiile mentinerii Un lot de muncitori (indivizi cu autonomie decizionala aceluiasi regim alimentar, scazuta) este investigat prin intermediul a doua chestionare pentru a controla inputul standardizate si validate din punct de vedere stiintific, ce energetic primit de organism, masoara gradul de solicitare resimtit pe post, respectiv se colecteaza lunar date cu nivelul intentiei de a parasi organizatia in care lucreaza privire la greutate si se compara diferentele in greutate sesizate intre lunile cu si cele fara activitate sportiva integrarea S-a constatat o crestere in S-a constatat absenta unei asocieri intre intentia de a parasi raspunsului greutatea corporala in lunile compania si nivelul de solicitare pe post in lipsa unor din fara activitate fizica intensa, perspectiva fapt ce sprijina teoria unei teorii surplusului de calorii neconsumate ce sta la baza cresterii in greutate Astfel, activitatea fizica este una din modalitatile de echilibrare calorica explicatii ce vizeaza limite metodologice, un asemenea rezultat ar trebui sa conduca la revizuirea modelului teoretic conform caruia suprasolicitarile postului (job strain) constituie un factor de risc in aparitia fluctuatiei de personal De exemplu, in studii viitoare ar putea fi cautati factori moderatori de care depinde aparitia efectului mentionat in teorie, cu alte cuvinte sa se arate ca efectul suprasolicitarii asupra fluctuatiei de personal apare doar in anumite conditii (de exemplu, un venit lunar nesatisfacator) 1 5 2 Cunostinte verificabile public Dupa empirismul sistematic, cea de a doua caracteristica majora a oricarei abordari stiintifice este aceea de a permite verificarea publica a demersului realizat si a rezultatelor obtinute Procedura de baza utilizata in acest sens este replicarea studiilor anterioare (Stanovich, 2010) Pentru ca acest lucru sa se intample, orice demers stiintific este descris suficient de detaliat incat sa permita altor persoane interesate sa replice studiul pentru a urmari masura in care sunt obtinute rezultate similare Aceasta masura poate fi privita ca o modalitate de protectie impotriva erorilor aparute in procesul de testare a ipotezelor, fie ele erori de tip i (rezultate semnificative statistic, cand nu exista un efect), de tip ii (rezultate nesemnificative statistic, cand exista un efect), de tip iii (rezultate semnificative statistic, dar in sens contrar celui asteptat) De asemenea, prin replicarea rezultatelor se ofera o siguranta suplimentara ca rezultatele nu sunt distorsionate de existenta vreunor probleme metodologice in cadrul procesului de replicare ideal ar fi ca demersul de replicare sa fie realizat de o alta echipa de cercetare decat cea care a descoperit initial efectul studiat, pentru a asigura o mai mare incredere in rezultatul replicat O alta modalitate esentiala de verificare publica a cunostintelor generate prin cercetari este aceea de a publica rezultatele in reviste de specialitate in care functioneaza evaluarea de tip colegial (peer-review) Chiar daca acest proces nu este lipsit de subiectivitate, acesta constituie cel mai bun mijloc existent de a evalua critic corectitudinea demersului stiintific efectuat si validitatea rezultatelor obtinute Desi prin multitudinea de reviste de specialitate existente intr-un domeniu (de exemplu, baza de date Psycinfo insumeaza peste 2 000 de reviste de specialitate - Stanovich, 2010) se pot strecura si studii cu rezultate invalide (problematice), absenta supunerii rezultatelor unei cercetari la procesul de evaluare colegiala este un semn clar a unui demers nestiintific in cazul evaluarii de tip peer-review rezultatele dobandesc o forta stiintifica mai mare daca sunt publicate: (a) in reviste iSi Web of Science de top, cu factor de impact ridicat pentru domeniul respectiv; (b) in reviste ce nu pot fi banuite ca fiind revistele casei (de exemplu, un articol favorabil unei teorii noi sa fie publicat intr-o revista distincta de cea care este condusa chiar de autorul articolului respectiv sau de initiatorii si sau sustinatorii respectivei teorii) in sfarsit, un alt aspect relevant ca urmare a introducerii principiului verificarii publice a cunostintelor este productivitatea crescuta a oricarui domeniu stiintific, avand loc frecvent (aproape cu fiecare deceniu) o revizuire sau inlocuire a teoriilor sau cunostintelor existente Acest progres rapid conduce treptat la consolidarea practicii psihologiei bazata pe validarea stiintifica (evidence based psychology practice), ceea ce presupune, in linii mari, implementarea de catre practicieni a celor mai bune modalitati de interventie pentru a solutiona diferite aspecte practice, in urma testarii eficientei in studiile de specialitate 1 5 3 Studiul problemelor rezolvabile Acum 100 de ani, o problema precum "reducerea simptomatologiei depresive prin intermediul realitatii virtuale" ar fi fost o tema care nu ar fi putut fi abordata stiintific Astazi, datorita progresului stiintific, o asemenea tema poate fi abordata stiintific in schimb, o tema precum "studiul efectelor interactiunii dintre oameni si fiintele extraterestre asupra imaginii de sine a fiintelor umane" nu poate fi considerata a fi o abordare stiintifica in prezent, dar ea ar putea deveni o tema respectabila de studiu in viitor, daca omenirea va fi marcata in existenta sa de asemenea evenimente potentiale Cu alte cuvinte, pentru a fi considerata stiintifica, o abordare trebuie sa apeleze la metode de investigatie care sa permita testarea empirica a problematicii studiate De aceea se poate pune un semn de egalitate intre studiul problemelor rezolvabile si cel de verificare a unor teorii sau modele explicative ce pot fi testate, adica verificate din perspectiva gradului lor de validare empirica Astfel demersul stiintific difera fundamental de cel pseudostiintific prin faptul ca abordarile pseudostiintifice apeleaza la teorii si concepte care nu pot fi falsificabile Un alt aspect important care distinge abordarile stiintifice de cele nestiintifice, in directia studierii unor probleme rezolvabile, este distinctia dintre operationalism si esentialism (Stanovich, 2010) Cautarea esentei ultime (de exemplu, "care este sensul vietii?", "ce inseamna cu adevarat altruismul?", "care este esenta moralitatii?") nu face parte dintr-o abordare stiintifica Abordarea stiintifica in aceasta directie ar incalca principiul problemelor rezolvabile (nu dispunem, cel putin momentan, de metode empirice de investigare a acestor aspecte) si prin urmare nu s-ar supune principiului falsificabilitatii, orice explicatie oferita ramanand la nivelul unei speculatii de tip filosofic Solutia pentru a aborda stiintific o tema este de a renunta la esentialism si de a operationaliza conceptele studiate ideea de baza a operationalismului este aceea ca, oricat de abstract ar fi la prima vedere un construct, acesta ar trebui masurat empiric printr-un indicator observabil La prima impresie acest lucru este usor de realizat, de exemplu, pentru a masura nivelul inteligentei generale a unei persoane cineva poate apela la rezultatul global obtinut de persoana respectiva la scalele de inteligenta Wechsler pentru adulti - WAiS-iV (Wechsler, 2008) insa modul de operationalizare a unui construct teoretic abstract poate conduce la indicatori variati, rezultati in urma unor decizii complexe care pot afecta demersul stiintific la nivelul validitatii sale de construct (vezi sectiunea 3 4 3) De pilda, pentru evaluarea satisfactiei maritale se poate apela la un indicator de autoraportare global pe o scala Likert in cinci trepte ("Per ansamblu cat de satisfacut(a) sunteti de relatia pe care o aveti cu sotia (sotul) dvs ?") sau la un indicator multidimensional bazat pe evaluarea relatiei dintre parteneri cu privire la mai multe aspecte: sexual, afectiv, de intr-ajutorare cu privire la aspectele administrative etc O alta modalitate de operationalizare a gradului de satisfactie in relatia de cuplu ar putea fi prin intermediul unei grile de observare completata de o persoana terta, care are acces sa urmareasca relatia de cuplu periodic Desigur, alte elemente luate in considerare pot afecta raspunsurile celor chestionati precum: perioada de raportare (in general, in ultimele sase luni etc ), utilizarea unor ancore facilitatoare cu rol comparativ (de exemplu, una este instructiunea de exprimare a gradului de satisfactie in comparatie cu celelalte cupluri pe care le cunoasteti, alta este exprimarea evaluarii in comparatie cu asteptarile pe care le aveti de la partener) La acestea se adauga eventualele limite ale metodelor utilizate, cum ar fi tendinta celor chestionati sa ofere raspunsuri dezirabile social De aceea este important ca in orice demers de operationalizare a conceptelor studiate sa se bazeze pe proceduri validate anterior (vezi sectiunea 3 4 3 destinata validitatii de construct) Prin definirea operationala a constructelor uzitate, abordarea stiintifica evita definirea ambigua, poetica a unor concepte atat de sensibile in psihologie precum inteligenta, dragostea, performanta etc Totusi, acest demers pragmatic nu este lipsit de critici, precum acuzele de definire tautologica a constructelor analizate (de exemplu, inteligenta este ceea ce testele de inteligenta masoara) Caseta 1 8 Formulari PiCO pentru studii din zona psihologiei si a psihoterapiei Studii clinice controlate Studiul diferentelor existente la nivelul depresiei (O) intre adolescentii delincventi (P) care au urmat o terapie cognitiv-comportamentala (i) si cei care au beneficiat de un program de consiliere standard, uzual (C) Studii longitudinale Copii adoptati (P) de catre cupluri in care cel putin unul dintre parinti a suferit efectuate pe esantioane ulterior un episod psihopatologic din Axa i a DSM, necesitand tratament de largi specialitate (i) au un risc mai crescut sa fie afectati de vreo tulburare mentala din Axa i (O) comparativ cu cei adoptati de cupluri fara istoric psihopatologic (C) Studii corelationale cu introducerea evaluarii constiinciozitatii (i) la candidatii pentru pozitii in rol predictiv domeniul vanzarilor din industria textila (P) prezice performanta lor ulterioara in munca (O) in aceeasi directie a studiului unor probleme rezolvabile, o varianta utila de lucru este de a formula tema studiata utilizand algoritmul PiCO intalnit in domeniul practicii validate stiintific Formatul PiCO (Spring, 2007) este utilizat pentru a formula intrebari de cercetare testabile Denumirea reprezinta acronimul de la populatia investigata (Population), interventia evaluata (intervention), elementul comparativ evaluat (Comparison) si de la rezultatul obtinut (Outcome) Dintre cele patru componente, elementul comparativ evaluat este singurul care poate avea un caracter optional, insa doar pentru cazul acelor studii care pot fi derulate adecvat in absenta unui grup de control (de exemplu, studiile corelationale) 1 5 4 Conectivitate cu teoriile si studiile anterioare Pentru a avea credibilitate stiintifica, orice teorie sau model nou propus ar trebui sa poata explica datele obtinute, cel putin la fel de bine ca teoriile deja existente Mai mult, teoriile si modelele noi devin superioare celor existente daca reusesc sa explice dinamica rezultatelor acolo unde teoriile anterioare din domeniu au esuat sa faca acest lucru in general, modelele explicative sunt interconectate intre ele interdisciplinar De pilda, modelul evolutionist are aplicatii variate in psihologie, biologie, economie O teorie este cu atat mai solida cu cat este sustinuta de datele colectate din diverse domenii de studiu Aceste aspecte mentionate sunt importante de retinut atunci cand evaluam potentialul stiintific al unor modele alternative propuse Astfel, Stanovich (2010) ofera exemplul a doua interventii ipotetice menite sa amelioreze dificultatile de citire ale elevilor din primul ciclu scolar, in contextul in care despre niciuna dintre ele nu exista date empirice privind eficienta lor terapeutica Sa denumim cele doua forme de interventie A, respectiv B interventia A presupune antrenarea constientizarii din partea copilului a caracterului segmentar al limbajului la nivel fonologic (prin exercitii de despartire in silabe) interventia B presupune antrenarea sensibilitatii la nivel vestibular a copiilor (prin exercitii repetate de mers pe barna cu ochii inchisi) in contextul in care interventia A se bazeaza pe unele dovezi empirice anterioare (de exemplu, existenta unei corelatii intre dificultatile de citire si nivelul scazut de constientizare a caracterului segmentar al cuvintelor), iar interventia B nu se fundamenteaza pe rezultatele niciunui studiu anterior, este de preferat sa se propuna interventia A ca modalitate de lucru, chiar daca inca nu sunt disponibile rezultatele vreunui studiu clinic controlat care sa demonstreze eficienta interventiei de tip A in sfarsit, asociata ideii de conectivitate este si principiul convergentei dovezilor, conform caruia, stiinta progreseaza treptat, pe masura ce anumite teorii primesc tot mai mult sprijin prin invalidarea explicatiilor alternative Niciun studiu nu este perfect Orice studiu are o serie de limite privind validarea sa, ca urmare este nevoie de un set de dovezi convergente (unele experimentale, altele obtinute intr-un context ecologic, altele longitudinale etc ) pentru a ajunge la un progres De aceea, stiinta tinde sa se bazeze din ce in ce mai mult pe rezultatele studiilor cantitative, de tip metaanalitic, pentru a raspunde unei probleme analizate si pentru a gasi noi aspecte de investigat 1 5 5 Scepticism si cautarea explicatiilor alternative Ar putea parea neobisnuit, dar unul dintre aspectele importante intr-un demers stiintific este tocmai atitudinea sceptica in fata afirmatiilor sau dovezilor prezentate de terti Astfel, chiar pentru situatii destul de evidente precum acelea ca frustrarea este asociata cu agresivitatea sau ca nivelul de inteligenta prezice performanta scolara, oamenii de stiinta au nevoie de dovezi concrete pentru ca nu se pot baza doar pe simtul comun, pe intuitie, sau pe opinia neverificata a vreunei autoritati in domeniu Mai mult, chiar in contextul in care ii sunt prezentate dovezi in sprijinul afirmatiilor respective, urmatorul pas intr-un demers stiintific corect nu este acela de a jubila si a proclama ca acesta este adevarul absolut, ci de a pune alte intrebari cu rol carcotas precum: "Exista alte studii care sa contrazica rezultatele gasite de noi?" sau "Ce alte teorii alternative (variabile confundate) ar putea explica (conduce la) acest rezultat?" Pentru a ilustra importanta unei atitudini sceptice in stiinta voi apela la exemplul oferit de Coolican (2004), cu referire la razboiul dintre gigantii bauturilor racoritoare Coca-Cola si Pepsi Cei de la Pepsi au prezentat un studiu realizat pe bautorii de Coca-Cola conform caruia mai mult de jumatate dintre consumatorii obisnuiti de Coca-Cola au considerat gustul bauturii Pepsi ca fiind mai bun decat cel al Coca-Cola, daca bauturile erau servite din doua pahare denumite M si Q, fara a sti insa in care dintre pahare se servea Pepsi, respectiv Coca-Cola in realitate, pentru o inregistrare cat mai corecta a studiilor, Pepsi era servita din paharul cu denumirea M, iar Coca-Cola din paharul cu denumirea Q impactul publicitar al acestui studiu a avut efect, raportul de vanzari in favoarea Coca-Cola scazand de la un raport de 3 la 1, la unul de 2 la 1 Aceasta evolutie a vanzarilor i-a determinat pe cei de la Coca-Cola sa argumenteze ca studiul anterior a fost construit inadecvat, pentru ca a oferit din start un avantaj pentru Pepsi Cola care fusese servit din pahare inscriptionate cu litera M, deoarece exista o preferinta implicita a oamenilor (cel putin a vorbitorilor de limba engleza) pentru litera M (de exemplu, mama) mai ridicata decat pentru litera Q De aceea, au realizat un alt studiu in care participantii erau manipulati sa creada ca trebuie sa aleaga intre doua bauturi racoritoare, puse in pahare inscriptionate cu M, respectiv Q S-a constatat ca un numar semnificativ mai ridicat persoane preferau bautura din paharul M comparativ cu cea din paharul Q, desi in amandoua era acelasi continut -Coca-Cola! Desi aparent, Coca-Cola a oferit un raspuns consistent, care a oferit o explicatie alternativa pentru rezultatele primului studiu, alta decat cea dorita de cei de la firma Pepsi, niciunul dintre cele doua studii nu a fost realizat adecvat pentru a raspunde la intrebarea legata de preferinta pentru una sau alta dintre bauturile racoritoare De exemplu, cel de-al doilea studiu, desi a reusit sa ofere o explicatie alternativa fata de cea prezentata de cei de la Pepsi, nu a reusit sa indice daca rezultatele din primului studiu se datoreaza in totalitate preferintei implicite pentru anumite litere sau daca acest efect este doar unul care modereaza intensitatea preferintei existente pentru Pepsi fata de Coca-Cola, la nivel de gust in opinia noastra, cel putin doua masuri de control a variabilelor straine ar fi trebuit luate in primul studiu pentru a elimina posibilele explicatii alternative in primul rand ar fi vorba de contrabalansarea tipului de bautura prezentata in paharele de tip M, respectiv de tip Q, precum si de contrabalansarea ordinii de prezentare a acestor bauturi (pornind de la premisa ca este posibil ca al doilea pahar gustat sa nu aiba acelasi efect gustativ decat primul, mai ales pentru participantii insetati) Astfel, daca jumatate dintre participanti ar fi primit Pepsi in pahare de tip M, iar cealalta jumatate in pahare de tip Q (si viceversa pentru Coca-Cola) am fi controlat efectul preferintei implicite pentru anumite litere si l-am fi putut lua in calcul De asemenea, daca jumatate dintre participanti ar fi baut mai intai Pepsi, iar cealalta jumatate ar fi baut mai intai Coca-Cola, am fi putut controla si lua in calcul si efectul de ordine a degustarii bauturilor Un asemenea design, nu le-ar fi permis celor de la Coca-Cola sa aduca drept explicatie alternativa ideea ca efectul se datoreaza preferintei pentru anumite litere, nu diferentelor de gust dintre bauturi Desigur, chiar si in cazul prezentei contrabalansarii, atitudinea sceptica fata de rezultatele obtinute ar fi putut fi invocata De pilda, s-ar putea ca rezultatele sa fie distorsionate din cauza faptului ca studiile nu au fost derulate in conditii de tip dublu-orb in cele doua studii derulate, doar participantii nu cunosteau ce se afla in cele doua pahare, in schimb experimentatorii stiau E posibil, chiar fara voia lor, sa fi influentat decizia participantilor la studiu, cei de la Pepsi avand o atitudine mai apropiata fata de participanti in momentul in care acestia degustau din paharul M (de Pepsi), iar cei de la Coca-Cola sa transmita involuntar mesaje non-verbale care sa-i influenteze in mai mare masura pe participanti sa prefere bautura din paharul inscriptionat cu litera M Un design dublu-orb, in care nici participantii, nici asistentii de cercetare care intrau direct in contact cu cei investigati, nu ar cunoaste tipul de bautura servita, asociat cu aplicarea masurilor de contrabalansare pentru a controla efectele de ordine sau alte variabile straine cum ar fi preferinta pentru anumite litere, ar fi condus la un studiu experimental bine controlat, care sa inlature eventualele critici (explicatii alternative) venite din partea celorlalti istoria stiintei este plina de asemenea exemple, poate cel mai celebru dintre ele fiind cel legat de malarie, a carei denumire originara din limba franceza, provine tocmai de la credinta falsa ca era declansata de aerul rau din zona mlastinilor (Mitchell si Jolley, 2006) Au fost efectuate chiar unele studii, aratand ca exista un numar mai mare de imbolnaviri in locuintele din apropierea baltilor si a mlastinilor decat in zonele cu teren uscat Desigur, ce sa neglijat in aceste explicatii initiale este faptul ca si tantarii, adevaratul mijloc de transmitere a bolii, se afla intr-un procent mai mare in zona baltilor si a mlastinilor decat in zone cu teren arid Concluzii Fascinatia societatii actuale pentru domeniul psihologiei este in crestere in special mass-media preia si dezbate teme din domeniul psihologiei intr-o masura mai mare decat se intampla in cazul altor stiinte insa deseori dovezile stiintifice sunt inlocuite de simple speculatii bazate pe intuitie si pe simtul comun La aceasta se adauga confuziile legate de asocierea psihologiei cu alte domenii precum parapsihologia, curentele de tip New Age, medicina alternativa, precum si intreaga industrie de tip self-help insa, poate cel mai puternic pericol provine tocmai din tagma psihologilor Destul de multi colegi nu reusesc sa faca distinctia dintre abordarea stiintifica si pseudostiinta Daca la nivel stilistic, exista un oarecare stereotip format despre pseudostiinte (vezi segmentul de jos al figurii 1 1), la nivelul continuturilor si al metodelor utilizate diferenta ramane, pentru multi, una nesesizabila Pseudostiintele tind sa fetisizeze rezultatele pozitive obtinute, sa ignore dovezile contrare, sa abuzeze de explicatii post hoc fara a le supune verificarii si sa-i acuze pe cei care contesta mesajul lor intr-un fel, este naturala aceasta tendinta umana de a cauta dovezi pentru a sustine ceea ce crezi, cu atat mai mult intr-un domeniu precum psihologia despre care multa lume are impresia ca se pricepe in stiinta se procedeaza intr-un mod diferit stiinta nu este definita de tema pe care o studiaza, ci de metodologia pe care o aplica in studierea temelor respective Aceasta trebuie sa fie riguroasa (empirism sistematic), iar rezultatele obtinute sa se supuna controlului public si atitudinii sceptice manifestate de catre colegii de breasla Cunostintele care trec cu succes prin aceste filtre sunt singurele care pot fi considerate ca fiind intemeiate, utile pentru evolutia stiintei si practicii psihologice Pana la urma este laudabil faptul ca cei mai multi dintre cei care aleg sa studieze psihologia fac acest lucru pentru ca "vor sa-i ajute pe ceilalti" sau pentru ca "vor sa se cunoasca mai bine pe ei insisi" insa, pentru a realiza aceste lucruri, este nevoie sa se utilizeze informatii si tehnici validate empiric, pe care numai o abordare stiintifica le poate oferi O asemenea abordare merita promovata inclusiv in randul acelora care se simt atrasi de misterele psihologiei, care utilizeaza teorii si concepte psihologice doar pentru a da sens si semnificatie propriilor experiente de viata si care sunt mai mereu predispusi sa ofere post hoc interpretari psihologizante pentru evenimentele traite Pentru multi dintre ei poate parea straniu sa abordezi stiintific teme precum dragostea romantica, insa intelegerea mecanismelor psihologice implicate in acest caz, intr-o maniera validata stiintific, va ajuta la prevenirea si la combaterea depresiei, a violentei domestice si va contribui la ameliorarea vietii de cuplu stiinta psihologiei nu face altceva decat sa filtreze informatiile din zona psihologiei pe baza datelor factuale si sa corecteze credintele gresite, astfel incat sa-i ajute mai eficient pe oameni si sa contribuie, prin cunoastere, la progresul societatii Lecturi suplimentare Skeptical inquirer (revista de specialitate) Aceasta revista este editata cu scopul de a evalua intr-o maniera critica, folosind metode stiintifice, orice afirmatie sau concluzie exagerata (neacoperita), care a trecut de filtrul evaluarii colegiale si a fost publicata in reviste stiintifice recunoscute Tema preferata de analiza este domeniul parapsihologiei, dar fara a se limita doar la aceasta Scott O Lilienfeld, Steven Jay Lynn, John Ruscio, Barry L Beyerstein (2010) 50 de mari mituri ale psihologiei populare inlaturarea conceptiilor gresite despre comportamentul uman Bucuresti: Editura Trei Cartea prezinta intr-o maniera jurnalistica 50 de mituri celebre din domeniul psihologiei (de exemplu, "ne folosim doar 10% din capacitatea creierului") pe care le analizeaza din perspectiva gradului lor de fundamentare stiintifica Subtitlul cartii este unul ilustrativ: inlaturarea conceptiilor gresite despre comportamentul uman Scott O Lilienfeld, Steven Jay Lynn, Jeffrey M Lohr (2004) Science and Pseudoscience in Clinical Psychology New York: Guilford Press Lucrarea este principala referinta bibliografica care delimiteaza intre abordarile stiintifice si cele pseudostiintifice in domeniul psihoterapiei in linii mari lucrarea analizeaza cele mai intalnite forme de interventie psihoterapeutica, precum si practicile de evaluare clinica, din perspectiva masurii in care acestea indeplinesc criteriile pentru a fi considerate demersuri validate stiintific Daniel David (2003) Castele de nisip stiinta si pseudostiinta in psihologia clinica Bucuresti: Editura Tritonic Cartea constituie primul semnal de alarma in spatiul romanesc cu privire la raspandirea curentelor pseudostiintifice in domeniul psihologiei clinice si a psihoterapiei Keith E Stanovich (2010), How to think straight about psychology (editia a iX-a) Boston: Pearson Lucrarea este una de referinta prin faptul ca reuseste sa prezinte publicului, intr-un limbaj accesibil, cum sa diferentieze intre abordarile riguroase, stiintifice din psihologie si incercarile pseudostiintifice din domeniu Este o lucrare care ar trebui introdusa obligatoriu in pregatirea academica a oricarui student la psihologie Bibliografie Academia Premiilor Nobel (2012) The Oficial Web Site for Nobel Prize Wilhelm Wundt Gasit la adresa http:  www nobelprize org  APA (2009) Presidential Task Force on the Future of Psychology Practice Final Report Gasit la adresa http:  www apa org pubs info reports future-practice pdf Bayerstein, B L (1996) Distinguishing science from pseudoscience Gasit la adresa: http:  www sld cu galerias pdf sitios revsalud beyerstein cience vs pseudoscience pdf Bem, D J (2011) Feeling the future: experimental evidence for anomalous retroactive influences on cognition and affect Journal of Personality and Social Psychology, 100, pp 404-425 Bringmann, W G , Ungerer, G A , Bringmann, M W (1995) Wilhelm Wundt and the workers' educational movement Psychologie und Geschichte, 6, pp 233-243 Callahan, R J (2001) Thought Field Therapy: Response to our critics and a scrutiny of some old ideas of science Journal of Clinical Psychology, 57, pp 1251-1260 Coolican, H (2004) Research methods and statistics in psychology (editia a iV-a) Londra: Hodder & Stoughton David, D (2010) Scrisoare catre babilonieni Disponibila la adresa http:  www psihologiaonline ro component content article 471-psihologul-daniel-david-avertizeaza-politicienii html FDSC (2010) Newly emerging needs of children in Romania An exploratory study raport al Fundatiei pentru Dezvoltarea Societatii Civile, gasit la adresa http:  www scribd com  doc 53063540 Newly-Emerging-Needs-of-Children-in-Romania-Exploratory-Study Goodheart, C D (2010) Economics and psychology practice: What we need to know Professional Psychology: Research and Practice, 41, pp 189-195 Gravetter, F J , Forzano, L -A (2009) Research methods for the behavioral sciences (editia a iV-a) Belmont: Wadsworth Henriques, G R , Sternberg, R (2004) Unified professional psychology: implications for the combined-integrated model of doctoral training Journal of Clinical Psychology, 60, pp 1051-1063 Herbert, J D , Lilienfeld, S O , Lohr, J M , Montgomery, R W , O'Donohue, W T , Rosen, G M , Tolin, D F (2000) Science and pseudoscience in the development of eye movement desensitization and reprocessing: implications for clinical psychology Clinical Psychology Review, 20, pp 945-971 Hyman, R (1977) Cold reading: How to convince strangers that you know all about them The Skeptical inquirer, 1, pp 18-37 Jansz, J (2004) Psychology and society: an overview in J Jansz si P van Drunen (eds ), A social history of psychology (pp 12-44) Oxford, UK: Blackwell Publishing Kaminer, W (1992) i'm Dysfunctional, You're Dysfunctional: The Recovery Movement and Other Self-Help New York: Addison Wesley Kendler, H H (1999) The role of value in the world of psychology American Psychologist, 54, pp 828835 Knapp, S , Keller, P A (2001) Professional associations' strategies for revitalizing professional psychology Professional Psychology: Research and Practice, 32, pp 71-78 Levant, R F (2003, ianuarie 1) Making psychology a household word National Psychologist, gasit la adresa http:  nationalpsychologist com 2003 01 making-psychology-a-household-word 10631 html Lilienfeld, S O , Landfield, K (2008) Science and pseudoscience in law enforcement: A user-friendly primer Criminal Justice and Behavior, 35, pp 1215-1230 Lilienfeld, S O , Lohr, M , Morier, D (2001) The teaching of courses in the science and pseudoscience of psychology Teaching of Psychology, 28, pp 182-191 Lilienfeld, S O , Lynn, S J , Lohr, J M (2004) Science and pseudoscience in clinical psychology: initial thoughts, reflections, and considerations in S O Lilienfeld, S J Lynn si J M Lohr (eds ), Science and pseudoscience in clinical psychology (pp 1-14) New York: Guilford Lilienfeld, S O , Lynn, S J , Ruscio, J , Beyerstein, B L (2010) 50 de mari mituri ale psihologiei populare Bucuresti: Editura Trei Louw, J (2002) Psychology, history, and society South-African Journal of Psychology, 32, pp 1-8 Marin, G (2009) Ce este eneagrama? Gasit la adresa http:  www empower ro inteligenta-emotionala ce-este-eneagrama  Mitchell, M L Jolley, J M (2006) Research design explained (editia a Vl-a) Belmont :Wadsworth Publishing Morar, O (2005) intelectualii romani si "chestia evreiasca" Contemporanul ideea Europeana, 6, disponibil la adresa http:  www romaniaculturala ro articol php?cod=7466 New World Encyclopedia (2008) Wundt Wilhelm Disponibil la adresa http:  www newworldencyclopedia org entry Wilhelm Wundt Patrick, J (2005) The economic value of psychology in Australia: 2001 Australian Psychologist, 40, pp 149-158 Pelham, B W , Blanton, H (2007) Conducting research in psychology Measuring the weight of smoke (editia a iii-a) Belmont: Thompson Wadsworth Popper, K (1981) Logica cercetarii Bucuresti: Editura stiintifica Postman, N (1986) Amusing ourselves to death: Public discourse in the age of show business New York: Penguin Saeman, H (1998, July) Survey: Psychologists' incomes plummet The National Psychologist, 7, pp 12 Savage, M (2009) Psychology and contemporary society Modern intellectual History, 6, pp 627-636 Spring, B (2007) Evidence-based practice in clinical psychology: What it is, why it matters; what you need to know Journal of Clinical Psychology, 63, pp 611-631 Stanovich, K E (2010) How to think straight about psychology (editia a iX-a) New York: Pearson Vlasceanu, L , Dusa, A , Rughinis, C (coord ) (2010) stiinta si societate interese si perceptii ale publicului privind cercetarea stiintifica si rezultatele cercetarii Raport de cercetare disponibil la adresa http:  www stisoc ro docs STiSOC2010 Raport%20de%20cercetare pdf Wechsler, D (2008) Wechsler Adult intelligence Scale (editia a iV-a) San Antonio: Pearson Wikipedia (2009) Bruno Bettelheim Gasit la adresa http:  en wikipedia org wiki  Bruno Bettelheim Desi cererea de servicii psihologice este in crestere la nivel mondial, trebuie mentionat faptul ca ritmul de crestere al cererii este sub cel de crestere a ofertei de servicii psihologice, fapt reflectat prin tendinta de scadere a nivelului de salarizare pentru psihologi (Saeman, 1998), de crestere a somajului in randul tinerilor absolventi de psihologie (Knapp si Keller, 2001) si de crestere a numarului de psihologi care au o opinie defavorabila despre aceasta profesie si care i-au in considerare o schimbare a domeniului de activitate (Knapp si Keller, 1998 apud Henriques si Sternberg, 2004) "in mathematical terms, Derrida’s observation relates to the invariance of the Einstein field equation under nonlinear space-time diffeomorphisms (self-mappings of the space-time manifold that are infinitely differentiable but not necessarily analytic) in this way, the infinite-dimensional invariance group erodes the distinction between observer and observed; the p of Euclid and G of Newton, formally thought to be constant and universal, are now perceived in their ineluctable historicity; and the putative observer becomes fatally decentered, disconnected from any epistemic link to a space-time point that can no longer be defined by geometry alone " in aceeasi directie, aspecte care tin direct de sfera spiritualitatii pot fi abordate stiintific (de exemplu, influenta rugaciunilor asupra emotiilor, substratul neurobiologic al starilor meditative, rolul religiozitatii in sanatatea mentala etc ) Spre deosebire de alte caracteristici ale unui abordari stiintifice (vezi figura 1 2), empirismul sistematic are o sfera de aplicabilitate limitata, indeosebi la nivelul stiintele empirice (naturale, ale vietii, sociale), fiind mai putin potrivit pentru a descrie situatia intalnita in cadrul stiintelor formale (matematica, logica) stiintele formale (analitice) nu sunt interesate de validarea teoriilor pe baza observatiilor colectate, ci de analiza proprietatilor unor sisteme formale pe baza unor definitii si a unor reguli de operare Unii autori considera drept demersuri stiintifice si topicile care nu reprezinta probleme rezolvabile in prezent (de exemplu, cautarea fiintelor extraterestre), atata timp cat metodologia din studiile respective respecta conditia falsificabilitatii in asemenea cazuri nu se ofera insa raspunsuri definitive cu privire la tematica investigata, iar uneori se poate ajunge la situatia stranie in care lipseste insasi dovada existentei obiectului de studiu Ceea ce conteaza este ca problemele sa fie rezolvabile in principiu, nu neaparat in prezent Astfel pot rezulta ipoteze interesante si se poate acumula un corp important de cunostinte (de exemplu, studiul conditiilor extreme in care poate aparea viata) Capitolul 2 Practica psihologica validata stiintific 2 1 Definirea si descrierea practicii validate stiintific Capitolul anterior are meritul de a trece in revista principalele diferente dintre o abordare stiintifica si una pseudostiintifica, cu referire indeosebi la specificul psihologiei ca stiinta insa, abordarea stiintifica nu vizeaza doar sfera academica, ci ar trebui sa se reflecte inclusiv in practica psihologilor De altfel, un deziderat frecvent intalnit in programele de formare profesionala a psihologilor este acela de a forma ceea ce in limba engleza se numeste scientist practitioners, cu alte cuvinte, de a pregati specialisti care sa fie buni practicieni, dar care sa posede si abilitati de cercetare idealul unui "practician-cercetator" este acela de a-si fundamenta practica pe solutii validate stiintific Pentru a nazui spre acest deziderat, practicienii trebuie sa fie consumatori critici ai literaturii de specialitate Aceasta presupune atat cautarea de informatii stiintifice pertinente pentru problemele din practica profesionala, cat si capacitatea de a discerne intre diferitele solutii de interventie existente, luand in calcul eficienta lor, dovedita prin studii empirice De asemenea, un practician-cercetator manifesta un interes direct pentru producerea de cunoastere, reflectata printr-un comportament activ in manifestari profesionale (Gaudiano si Statler, 2001; Overholser, 2010) Aceasta viziune despre practica psihologica a fost teoretizata initial inca din anii '50 ai secolului trecut, fiind cunoscuta si sub numele de modelul Boulder, un model originar din zona psihologiei clinice (Striker, 1997) Un alt concept important este cel de practica validata stiintific (evidence-based practice sau EBP) intre conceptul de EBP si cel de practician-cercetator exista o suprapunere ridicata, chiar daca cele doua aspecte nu au un istoric comun Practica validata stiintific (EPB) isi are originea in domeniul stiintelor medicale, unde a cunoscut o dezvoltare foarte puternica Atat ca urmare a unor similitudini ridicate dintre domeniul clinic al medicinei si al psihologiei, cat si ca urmare a similaritatilor conceptuale dintre conceptul de practician-cercetator si cel de specialist care ofera servicii validate stiintific (bazate pe dovezi empirice), transferul dintre medicina spre psihologie s-a facut mai intai in zona psihologiei clinice, dar se extinde din ce in ce mai mult in toate ariile de interes ale psihologiei Practica validata stiintific vizeaza in primul rand cerinta ca in deciziile din practica profesionala sa se ia in calcul implementarea de solutii pentru care exista dovezi validate stiintific cu privire la eficienta lor Desi se are in vedere rolul de producator de cunoastere (realizator de cercetari), accentul cade pe rolul de consumator critic al literaturii de specialitate, in vederea identificarii solutiilor cu cel mai ridicat nivel de eficienta La fel de importanta este expertiza profesionala a practicianului de a putea decide contextual daca solutiile oferite de literatura de specialitate sunt potrivite pentru problema concreta de rezolvat Astfel, pe langa aspectele stiintifice, se tine seama de nevoile si asteptarile clientului, astfel incat decizia de a selecta o anumita forma de interventie sa se faca avand consimtamantul clientului Asa cum am precizat, cele doua concepte discutate difera ca origine Daca conceptul de practician-cercetator a fost dezvoltat de psihologii clinicieni, ideea practicii validate stiintific isi are originea in domeniul medicinei De altfel, o definitie consacrata a EBP sustine ca aceasta este un proces care implica analizarea intr-o maniera responsabila, explicita, a dovezilor existente in literatura de specialitate cu privire la eficienta diferitelor forme de interventie, cu scopul de a lua decizii adecvate cu privire la modul de ingrijire a unui pacient (Sackett, Rosenberg, Gray, Haynes si Richardson, 1996) in sfarsit, in literatura de specialitate unele surse (APA, 2006) fac o alta delimitare intre EBP si interventiile validate stiintific (empirically supported treatments sau EST) Conform acestora, EBP, desi face apel la identificarea interventiilor validate stiintific pentru problema avuta, presupune mai mult decat atat, fiind un demers complex de tip ideografic (APA, 2006), in timp ce interventiile validate stiintific constituie o componenta integrata in EBP, rezultata in urma unei abordari de tip nomotetic (de exemplu, analiza studiilor de specialitate pentru a raspunde la intrebarea: "este terapia familial-sistemica o modalitate eficienta de interventie in cazul adolescentilor care au aflat recent ca au fost infiati?") Astfel, EST vizeaza cu precadere interventia, in timp ce EBP vizeaza cu precadere clientul, utilizand informatiile cu privire la interventiile validate stiintific ca unul dintre inputurile necesare pentru a lua cea mai buna decizie pentru clientul asistat (APA, 2006, Levant si Hasan, 2008) Astfel, conform acestei viziuni EBP se refera la procesul integrarii informatiilor din literatura de specialitate (cu privire la cele mai eficiente interventii validate stiintific), cu expertiza practica, in contextul analizei preferintelor si a caracteristicilor culturale si demografice ale clientilor care solicita servicii psihologice (APA 2006, Spring, 2007), pentru a se atinge efectul dorit de client (de exemplu, reducerea nivelului de conflict munca-familie, cresterea satisfactiei maritale, reducerea anxietatii sociale, cresterea performantei scolare etc ) Acest model de conceptualizare a EBP este cunoscut si sub numele de modelul scaunului cu trei picioare (the three legged-stool) (Spring, 2007) Figura 2 1 Cele trei brate ale practicii validate stiintific Pe scurt, EBP inseamna a lua decizii in baza expertizei profesionale, a caracteristicilor clientului si a informatiilor la zi cu privire la cele mai eficiente tipuri de interventie pentru a solutiona problema intalnita Conceptul de EBP sa raspandit rapid din domeniul medicinei spre alte profesii din zona sanatatii (psihologie clinica si psihoterapie, asistenta medicala, farmacie), dar si in domenii diferite precum management, pedagogie sau asistenta sociala (Briner si Rousseau, 2011; Craig si Smyth, 2002; Gibbs, 2002; Kratochwill si Shernoff, 2004; Noonan, 2009; Norcross, Beutler si Levant, 2006; Rousseau, 2006; Sackett, Strauss, Richardson, Rosenberg si Haynes, 2000 etc ) Pentru a vedea mai concret ce ar insemna o abordare EBP in practica psihologica, vom ilustra in tabelul 2 1 intrebarile de baza la care ar trebui sa raspunda un psiholog organizational atunci cand ar fi solicitat, in calitate de consultant, sa rezolve problema fluctuatiei de personal dintr-o companie in functie de raspunsurile gasite la aceste intrebari (sau macar la cea mai mare parte a acestora), psihologul va cauta sa ia cea mai buna decizie pentru a solutiona problema respectiva Tabelul 2 1 intrebari specifice unei abordari EBP pentru reducerea fluctuatiei de personal Perspectiva A1 Exista cazuri similare anterioare in portofoliul meu de servicii? Ce solutii au fost practicianului propuse? Au functionat? A2 Care cred ca sunt cauzele si solutiile posibile in acest caz? A3 Este o situatie specifica companiei sau este afectata intreaga industrie de ramura si sau zona in care este localizata firma? A4 Care este profilul organizatiei beneficiare? A5 Care este politica actuala a companiei pentru a preveni fluctuatia de personal? A6 Exista date interne utile (de exemplu, chestionare aplicate la plecarea din firma pentru a vedea motivatiile specificate profilul celor care pleaca sau alte studii care sa indice situatia actuala privind intentia de a parasi organizatia)? A7 Care sunt cauzele fluctuatiei in opinia conducerii companiei? A8 Ce solutii au aplicat competitorii directi pentru a rezolva aceasta problema? Perspectiva B1 Care este rata fluctuatiei de personal in acest domeniu? cercetatorului B2 Care sunt principalele cauze (factori de risc) ale fluctuatiei de personal, rezultate din analiza critica a literaturii de specialitate? B3 Exista interventii validate stiintific tintite pentru a reduce fluctuatia de personal? B4 Care este utilitatea lor practica (marimea efectului)? B5 Cat de puternice sunt dovezile pe care le avem despre eficienta interventiilor identificate (care este nivelul lor de validare stiintifica, de suport empiric)? B6 Cat de relevante sunt studiile respective (cat de bine se potrivesc) luand in calcul contextul particular al organizatiei beneficiare? B7 Care dintre interventiile eficiente s-a dovedit a avea cel mai bun raport cost-beneficiu? Perspectiva C1 Solutia propusa ar starni reactanta (rezistenta) din partea personalului firmei? clientului C2 Care este opinia conducerii despre solutia propusa? C3 Ce alte solutii ar fi preferate sunt luate in calcul de catre conducerea companiei? C4 Ce consecinte negative (efecte secundare nedorite) ar putea aparea in urma aplicarii interventiei propuse? C5 Care ar fi pozitia conducerii fata de aceste consecinte secundare? C6 Ce dificultati sunt probabile sa apara in procesul de implementare a interventiei? C7 Ce alte probleme neidentificate explicit de client pot fi rezolvate (diminuate) prin interventia propusa? Totusi, o serie de surse recente tind sa trateze cele doua concepte de EST si EBP ca fiind sinonime (APA, Divizia 12 de Psihologie Clinica, 2012) Conform acestora, EBP este un concept integrator care indica orice tip de activitate (interventii validate stiintific - EST, evaluari validate stiintific -ESA, evidence based assessment) pentru care exista suport stiintific Conform acestei interpretari, EBP nu reprezinta altceva decat EST, ci reflecta un concept integrator sinonim, pentru a cuprinde orice activitate practica (inclusiv componenta de evaluare psihologica), organizata pe baza acelorasi principii enuntate mai sus De aceea, destul de multi autori utilizeaza EBP si EST alternativ, fara a face distinctie intre ei (David, comunicare personala, 22 aprilie 2012) 2 2 Necesitatea tranzitiei catre o practica validata stiintific Cadrul conceptual privind EBP este unul extrem de atragator, fapt ce a condus la expansiunea si imbratisarea modelului dincolo de zona stiintelor medicale, unde ramane insa cel mai bine raspandit in realitate, insa, cei mai multi practicieni, inclusiv din domeniu medicinei, se raporteaza la acest cadru ca la un model normativ, prescriptiv Daca analizam nivelul descriptiv, vom constata faptul ca cei mai multi psihologi practicieni raman blocati la nivelul perspectivei practicianului din tabelul 2 1 Din aceasta perspectiva, in cazul EBP exista o mare discrepanta dintre teorie si practica De pilda, doar aproximativ jumatate dintre medici studiaza literatura de specialitate pentru a lua decizii in practica lor curenta (Bennett et al , 2003; Humphris, Littlejohns, Victor, O'Halloran si Peacock, 2000) Nu se cunoaste insa cifra celor care evalueaza critic informatia citita, nici a celor care decid o solutie luand in calcul si preferintele valorile pacientului De asemenea, mai putin de 1% dintre manageri citesc studii de specialitate pentru a-si fundamenta deciziile (Rynes, Giluk si Brown, 2007) Discrepanta dintre modelul teoretic si proba realitatii este una foarte mare si in domeniul psihologiei (Wilson, Armoutliev, Yakunina si Werth Jr , 2009) Din nefericire, cel mai adesea deciziile practicienilor se bazeaza mai degraba pe cutume profesionale introduse, fie in baza unei analize rationale, a intuitiei sau a simtului comun, fie pur si simplu in baza unui comportament mimetic ("pentru ca asa au procedat si altii") Foarte rar deciziile din practica psihologica se bazeaza pe dovezi empirice, validate stiintific Caseta 2 1 Doua cazuri specifice de interventii nevalidate stiintific Exemplul 1 Programul de "infricosare directa" (scared straight) adaptare dupa Petrosino, Turbin-Petrosino si Buehler (2009) ideea programului a venit de la un film documentar distins cu premii de specialitate in 1978, in care un grup de adolescenti delincventi era pus fata in fata cu un grup de infractori periculosi Acestia ii intimidau pe adolescenti cu scopul de a-i speria si de a-i determina sa realizeze ca se afla pe un drum gresit care le va aduce multa suferinta, daca nu renuntau la comportamentele lor delincvente ideea a fost preluata si introdusa in practica pe scara larga, indeosebi in SUA si in Marea Britanie pe detinuti adolescenti si tineri Acestia erau expusi in direct in fata unor confrati condamnati la inchisoare pe viata cu scopul de a constientiza consecintele unei asemenea perspective si a-i speria sa nu ajunga ca ei, astfel incat sa nu comita acte de recidiva Asemenea programe par sa functioneze deoarece 94% dintre cei care au intrat in program nu au recidivat ulterior (comparatii facute exclusiv pe grupul beneficiar, fara vreun grup de control) Surpriza insa! in urma unei analize adecvate (ce presupune compararea evolutia detinutilor care au beneficiat de acest program cu cele ale detinutilor din grupurile de control, in cadrul unor studii randomizate), se observa un efect daunator al programului sansele de a comite infractiuni sunt cu aproximativ 70% mai mari in cazul celor care au participat la acest program decat in cazul celor care nu au "beneficiat" de o asemenea masura corectiv-educativa Cu exceptia unui singur studiu, in toate celelalte cercetari au fost obtinute efecte negative semnificative statistic Exemplul 2 Programele educative adresate tinerilor soferi din Marea Britanie cu scopul de a reduce numarul de accidente rutiere, adaptare dupa ig si Kwan (2001), actualizat in 2008 Un asemenea program educativ ar fi necesar daca am lua in considerare doua cifre statistice: tinerii cu varsta intre 17 si 21 de ani reprezinta 7% din populatia celor care detin un permis de conducere in UK, dar produc 13% din totalul accidentelor, ceea ce inseamna ca este un grup-tinta predispus sa comita accidente de circulatie in baza unui sondaj de opinie (chestionar) cu o rata de raspuns de 36%, s-a constatat ca tinerii care au urmat un program de educatie rutiera si-au modificat atitudinea in directia oferirii unor raspunsuri ce indica o atitudine prudenta in trafic, reducand riscul aparitiei accidentelor de circulatie Aceasta comparatie s-a bazat pe un studiu de tip pretest-posttest fara un grup de control, cu o distanta de 3 luni intre testari, acestea avand loc inainte si dupa implementarea programului educativ Statul britanic a investit multi bani in extinderea acestui tip de programe pe scala larga, desi datele obtinute in urma unei evaluari serioase a literaturii de specialitate evidentiaza faptul ca asistam la o risipa de bani publici Astfel, analizand eficienta acestor programe de formare (incluzand doar studii randomizate) se constata ca nu exista diferente semnificative intre cei care urmeaza asemenea programe si cei din grupul de control cu privire la frecventa implicarii in accidente de circulatie Cu alte cuvinte, nu exista sprijin empiric solid pentru eficienta acestor programe de educatie rutiera Dincolo de specificul celor doua problematici discutate, ar fi esential pentru orice practician din sfera psihologiei, care adopta o atitudine profesionista, sa inteleaga ca: a) pentru rezolvarea diverselor probleme aparute nu este suficient ca interventiile selectate sa se bazeze doar pe opinii ale specialistilor cu privire la ceea ce ar putea sa functioneze; de exemplu, a afirma ca statul ar trebui sa investeasca mai multi bani in programe de educatie rutiera pentru a reduce numarul tinerilor implicati in accidente de circulatie pare o solutie de bun-simt, intalnita frecvent in discursul public sau de tip jurnalistic; este insa nevoie sa existe dovezi empirice ca programele respective ar fi eficiente pentru a lua in calcul asemenea solutii intr-o abordare de tip EBP; b) dovezile empirice in favoarea uneia sau alteia dintre formele de interventie nu sunt egale din perspectiva validitatii lor stiintifice (de exemplu, studiile randomizate sunt preferabile studiilor de tip non-experimental); de aceea adeptii EBP ar trebui sa poata distinge intre diferite tipuri de studii, din perspectiva calitatii dovezilor oferite de acestea (vezi detalii in sectiunea 2 3 2 a acestui capitol); c) la ora actuala nu exista dovezi validate stiintific pentru orice tip de interventie propusa; de aceea ar trebui sa se faca o distinctie intre interventiile derulate in absenta dovezilor validate stiintific (pentru care nu exista studii) si interventiile care nu sunt sprijinite de dovezile colectate (studiile nu sustin eficienta interventiei); interventiile din cea de-a doua categorie ar trebui eliminate din practica curenta, in timp ce interventiile din prima categorie pot fi luate in seama doar daca nu exista alte interventii validate stiintific, a caror eficienta a fost demonstrata; d) din perspectiva EBP, identificarea unei interventii validate stiintific in urma analizei critice a literaturii de specialitate este o masura necesara, chiar esentiala, dar nu si suficienta; alegerea interventiei ar trebui sa tina seama si de alte aspecte existente precum: (1) resursele avute la dispozitie (raportul cost-eficienta, vezi capitolul 6); (2) validitatea stiintifica a cadrului conceptual, a teoriei pe care se bazeaza interventia (detalii in sectiunea 2 3 3 a acestui capitol); (3) caracteristicile individului sau a grupului pe care se doreste a fi implementata solutia Pentru explicatii suplimentare legate de ultimul punct mentionat (d), voi ilustra cazul abandonului scolar impactul pe termen mediu si lung al acestei probleme este unul negativ, atat pentru indivizii in cauza (somaj crescut, risc crescut de infractionalitate, calificare profesionala scazuta), cat si pentru societate, prin costurile sociale pe care le genereaza in vederea prevenirii abandonului scolar au fost incercate de-a lungul timpului mai multe tipuri de interventii care ar putea fi grupate in: (a) interventii educationale la nivel scolar (restructurarea curriculei, a orarului pentru activitatile de scoala reducerea raportului de elevi per cadru didactic etc ); (b) interventii educationale la nivel individual (meditatii, asistenta in rezolvarea temelor de casa); (c) interventii educative in comunitate (implicarea elevilor in activitati educative non-formale cum ar fi proiecte comunitare de asistenta a varsinicilor pentru a surprinde elemente ce tin de biologie, psihologie, istorie etc ); (d) interventii comunitare legislative (de exemplu, programe de tip "cornul si laptele" sau amendarea parintilor care nu isi monitorizeaza copiii si care nu se ingrijesc ca acestia sa frecventeze scoala in ciuda unor atentionari repetate prealabile primite prin scrisori de informare); (e) programe de consiliere a parintilor cu privire la importanta scolii si la consecintele abandonului scolar; (f) interventii cu scopul dezvoltarii unor abilitati psihologice individuale la elevi (imbunatatirea nivelului de autoeficacitate educationala, reducerea distresului legat de scoala, imbunatatirea atitudinii fata de scoala) etc in fata unui numar atat de insemnat de optiuni, primul impuls ar fi acela de a decide interventia cea mai potrivita in urma unei dezbateri intre specialisti, luand in calcul opiniile acestora sau experienta unor studii de caz intr-o perspectiva EBP, demersul de solutionare este diferit, modelul standard impunand implementarea succesiva a celor cinci pasi necesari (Sackett et al , 2000): (1) reformularea problemei principale sub forma unei intrebari de investigat (pe cat posibil sub forma modelului PiCO explicitat in cadrul sectiunilor 1 5 3 si 7 2 1 din carte); in exemplul oferit, sa spunem ca se urmareste implementarea unei solutii la nivel local (scolile arondate psihologului scolar), motiv pentru care solutiile (a) si mai ales (d) nu sunt fezabile, depinzand de modificari la nivel de sistem, iar solutia (e) este putin aplicabila, deoarece este vorba de o comunitate cu foarte multi parinti plecati la munca in strainatate; in consecinta raman in analiza pentru pasul 2 solutiile (b), (c) si (f) si intrebarea de a vedea care dintre cele trei variante este mai eficienta in prevenirea abandonului scolar; (2) analiza literaturii de specialitate in vederea identificarii de dovezi empirice valide din punct de vedere stiintific, cu privire la cea mai eficienta forma de interventie pentru a preveni abandonul scolar, precum si a factorilor moderatori care pot augmenta efectul (varsta scolarilor, tipul de comunitate - urban rural etc ); in aceasta directie sunt cautate in special studii metaanalitice (vezi capitolul 7); pentru problematica abandonului este identificat un astfel de studiu in cadrul colectiei Campbell (Wilson, Tanner-Smith, Lipsey, Steinka-Fry si Morrison, 2011) ce sintetizeaza 167 de studii; concluzia studiului metaanalitic este aceea ca toate cele trei solutii sunt eficiente, reducand abandonul scolar (vezi figura 2 2); Tabelul 2 2 Trei criterii si intrebari fundamentale aferente intalnite in faza de evaluare critica a analizei de specialitate (pasul 3) Validitatea Ma pot increde in rezultatele studiilor respective? importanta practica Efectul produs este suficient de mare pentru a avea o relevanta practica? Aplicabilitate Pot utiliza aceste informatii in cazul concret de rezolvat? (3) evaluarea critica a rezultatelor provenite din analiza literaturii de specialitate; desi toate cele trei solutii par a fi eficiente in prevenirea ratei de abandon scolar, cea care implica elevii in programe educationale non-formale ce presupun servicii pentru comunitate pare a fi cea mai eficienta (riscul de abandon scolar fiind de 3,53 ori mai mic pentru cei care au fost implicati in astfel de programe comparativ cu cei aflati in loturi de control); totusi, pentru acelasi tip de interventie se observa si variabilitatea cea mai mare in eficienta programelor (intervalul de incredere sugerand valori cuprinse intre 1,90 si 6,54), ceea ce inseamna ca efectul este dependent de o multitudine de factori, fiind mai putin robust; tot din perspectiva increderii in rezultate se poate urmari daca aceste valori se bazeaza preponderent pe studii experimentale (randomizate) sau sunt obtinute in special din studii de tip cvasiexperimental (vezi detalii despre acest subiect in sectiunea 2 3 2 si in capitolul 4); in exemplul dat cele mai multe date provin din studii cvasiexperimentale ceea ce reduce, intr-o oarecare masura, nivelul calitativ al dovezilor privind eficienta acestor forme de interventie; 1,40(0,94, 2,09) 1,46(1,30, 1,63) 1,87 (1,49, 2,36) 1 94 (1 34,2,82) 2,06(1,50, 2,81) 2,14 (1,75, 2,62) 2,23 (1,89, 2,64) 2,35 (1 69, 3,28) 2,46(1,70, 3,57) 2,62 (1,97, 3,47) 2,64 (2,12, 3,28) 3,53 (1,90, 6,54) Tipul interventiei n к Altele 13 13 Monitorizarea prezentei 26 26 Pachet de servicii 23 23 scoala alternativa 30 30 Pregatire academica suplimentara (meditatii) м 32 Jjt, Managementul cazului 17 17 Restructurarea clasei sau a scolii 105 105 Formarea abilitatilor  СВГ ★ 12 12 Pregatirea pentru 25 25 universitate Consiliere, mentorat 27 27 Vocational   Angajare 51 51 Serviciu comunitar ’ЙГ 24 24 Raportul sanselor (95% Ci) Figura 2 2 Rezultatele metaanalizei efectuate de Wilson et al (2011) Legenda: marcate cu steluta sunt cele trei interventii de interes; n - numar de marimi ale efectului; k -numar de studii independente; raportul sanselor (detalii legate de interpretarea metaanalizei in capitolul 7, sectiunile 7 2 1 si 7 2 3); (4) luarea deciziei si implementarea interventiei selectate; in privinta deciziei se au in vedere toate cele trei componente incluse intr-o abordare de tip EBP (informatii privind interventiile validate stiintific existente, privind caracteristicile si valorile clientului si din expertiza profesionala a profesionistului); de exemplu, intr-o asemenea decizie, tinand cont ca orice forma de interventie necesita resurse, se poate lua in calcul nu numai eficienta interventiei, ci si un raport cost-eficienta; de asemenea se poate analiza gradul de similaritate intre contextul in care urmeaza sa se implementeze interventia selectata si cel al studiilor in care a fost validata interventia respectiva; astfel, daca 90% dintre studiile care implementau programe educationale non-formale cu implicarea comunitatii vizau elevi proveniti din familii de imigranti de prima generatie din comunitati multiculturale, acestea s-ar putea sa fie inadecvate pentru a fi aplicate in preventia abandonului scolar din satele romanesti; nici varianta dezvoltarii de abilitati psihologice nu ar fi posibila intr-un asemenea context din lipsa unui personal calificat in acest mediu pentru aplicarea interventiilor psihologice; pe scurt, in judecarea situatiei practice intalnite se va tine cont atat de specificul contextual, cat si de dovezile stiintifice existente cu privire la eficienta interventiei respective; in sfarsit, in privinta implementarii solutiei selectate, acest lucru ar trebui sa fie realizat in baza unui ghid (protocol) de aplicare, pentru a maximiza sansele de reproducere a efectelor pozitive din studiile de specialitate; (5) monitorizarea si evaluarea eficientei interventiei; in urma aplicarii interventiei este important sa se urmareasca daca si-a atins scopul pentru care a fost implementata, precum si ce dificultati (implicit masuri corective) au fost identificate ca fiind necesare in aplicarea interventiei Din nefericire, exista o discrepanta mare intre acest algoritm prescriptiv de lucru, specific EBP, si realitatea de zi cu zi Desi o stiinta matura ar trebui sa se bazeze mai mult pe protocoale standard de interventie (vezi modelul EBP promovat in medicina) decat pe impresii si intuitii personale, se intampla adesea ca masurile de interventie luate de multi specialisti din domeniul psihologiei sa fie bazate pe solutii decise intuitiv, fara o analiza aprofundata a celor mai bune practici din domeniu Acest lucru este facilitat si de existenta unor bariere in aplicarea modelului EBP, cele mai importante fiind sintetizate in tabelul 2 3 Tabelul 2 3 Bariere intalnite in aplicarea modelului EBP in practica psihologica Bariera Descriere Timp limitat Uneori li se solicita psihologilor sa ofere ad-hoc recomandari practice intr-o abordare EBP ar fi nevoie, de cele mai multe ori, de timp pentru a consulta literatura de specialitate si a identifica interventii validate stiintific pentru problematica respectiva Acces limitat la in contextul in care se publica atat de mult, iar cea mai importanta baza de date din resurse domeniul psihologiei (Psycinfo) este accesibila doar in regim contra cost, practicienilor le este greu sa realizeze o evaluare adecvata a literaturii de specialitate Abilitati reduse Multor practicieni le lipsesc cunostintele necesare pentru a analiza critic literatura de de cercetare specialitate, inclusiv la nivelul de a diferentia intre studii in functie de calitatea dovezilor stiintifice Aceste abilitati pot fi dobandite in special prin programe doctorale sau prin programe masterale serioase, insa nu toti practicienii au un asemenea nivel de pregatire profesionala Presiune Spre deosebire de alte domenii unde specializarile sunt foarte precise, in domeniul scazuta de serviciilor de psihologie sau conexe acesteia se intampla frecvent sa existe consultanti profesionalizare cu pregatire variata (ingineri, economisti etc ) in plus, desi exista o specializare inclusiv in domeniul psihologiei (de exemplu, psiholog clinician, psiholog educational etc ), exista multe cazuri de practicieni cu atestat in multiple specialitati, fiind greu de crezut faptul ca acestia pot performa in toate specialitatile pe care le detin De asemenea, erorile intalnite in actul psihologic sunt rareori supuse unui demers de malpraxis, cum se intampla adesea in cazul serviciilor medicale, prin urmare exista mai putina presiune de tip punitiv cu privire la consecintele deciziilor luate in practica psihologica Diversitatea in psihologie exista o multitudine de directii teoretice cu un aparat conceptual propriu, conceptuala fapt care conduce adesea la suprapuneri si ambiguitati terminologice Aceasta diversitate de opinii creeaza dificultati in acceptarea unui model comun, pragmatic, cum este cel bazat pe EBP, mai ales din partea practicienilor adepti ai unor perspective teoretice mai putin fundamentate stiintific (empiric) Dincolo de aceste bariere este esential pentru viitorul domeniului aplicativ al psihologiei sa se adopte pe scala larga modelul EBP din motivele expuse in cele ce urmeaza includerea serviciilor psihologice in cadrul asistentei complexe interdisciplinare in cele mai multe cazuri, problemele oamenilor sunt abordate interdisciplinar De exemplu, la ora actuala se tinde spre oferirea unor servicii integrate de sanatate (persoanele care au suferit un traumatism grav al membrului superior pot beneficia, pe langa asistenta medicala de specialitate, de servicii de kinetoterapie, precum si de servicii psihologice pentru a facilita coping-ul adaptiv la noua situatie si pentru a identifica cele mai potrivite cai de reinsertie socioprofesionala) in contextul in care profesiile din zona medicala au implementat deja modelul EBP, exista o presiune suplimentara pentru practicienii din domeniul psihologiei de a-si alinia solutiile la aceeasi paradigma de lucru Acest lucru nu se intampla doar in zona serviciilor de sanatate (unde modelul EBP este cel mai avansat), ci incepe sa fie intalnit si in alte domenii de activitate (educatie - EBP in pedagogie; asistenta sociala -EBP in asistenta sociala; management - EBP in management etc ) Astfel, EBP ofera un cadru comun de raportare, fiind un model pragmatic si ateoretic, bazat pe identificarea celor mai potrivite solutii validate stiintific pentru o problema data Eficientizarea serviciilor psihologice in mod curent (traditional), conform unor date din domeniul stiintelor medicale (apud Peterson, 2006), este necesar sa treaca 17 ani de la publicarea rezultatelor cercetarilor cu privire la eficienta unei forme de interventie pana la includerea acesteia, intr-o masura relativ extinsa, in practica curenta Aceasta distanta este necesara pentru ca adesea informatiile provenite din articole de specialitate nu sunt citite direct de catre practicieni Acestia din urma prefera sa isi fundamenteze opiniile pe ceea ce cunosc deja din perioada facultatii sau pe informatii provenite din tratate fundamentale de specialitate, care sintetizeaza un domeniu anume insa de cele mai multe ori este nevoie de timp pentru ca un concept sau o forma de interventie anume sa treaca din zona articolelor stiintifice, tributare unui limbaj tehnic si statistic uneori greu de descifrat, in zona unor recomandari concrete transmise studentilor in formarea lor academica sau specialistilor in formarea lor profesionala continua Prin abordarea EBP se solicita studiul aprofundat al literaturii de specialitate de ultima ora (de exemplu, studii experimentale, metaanalize), iar acest aspect conduce la reducerea drastica a perioadei de timp necesara unei interventii pentru a intra in practica de zi cu zi Acest lucru le permite practicienilor adepti ai EBP sa aiba un avantaj in fata colegilor lor, printr-un plus de eficienta la nivelul rezultatelor obtinute, ca urmare a accesului la cele mai recente solide descoperiri stiintifice de interes pentru domeniul lor de expertiza si a fundamentarii practicii lor pe solutii dovedite a fi eficiente Accesul la fondurile publice Adaptand un slogan politic la moda, am putea spune ca interventiile validate stiintific constituie o asigurare pentru contribuabil ca taxele si impozitele platite catre stat se regasesc in accesul la servicii eficiente De altfel, discursul autoritatilor in aceasta directie este acela ca resursele limitate existente ar trebui alocate catre acele interventii pentru care exista dovezi validate stiintific ca sunt eficiente, ca produc efectele scontate Acesta este si unul dintre motivele extinderii modelului EBP in domeniul sanatatii, fiind facilitata de decizia autoritatilor din Marea Britanie, practica preluata apoi si de alte state, de a aloca fonduri si de a deconta servicii numai pentru acele interventii din sfera sanatatii pentru care exista dovezi stiintifice solide cu privire la utilitatea lor (Spring, 2007) De aceea, sansa psihologilor de a-si deconta serviciile prestate din fonduri publice consta in demersul de a dovedi ca dispun de interventii validate stiintific pentru problemele aparute Acest lucru este cu atat mai important cu cat aproape toate serviciile psihologice (educationale, clinice etc ), cu exceptia domeniului psihologiei muncii si organizationale si partial a psihoterapiei (in unele state), sunt finantate din fonduri publice insa nu numai autoritatile de stat sunt interesate sa se implementeze cele mai eficiente forme de interventie, ci si alti finantatori De exemplu, companiile private de asigurari medicale din anumite tari au stabilit ca pot fi decontate servicii de psihologie daca: (a) exista dovezi empirice validate stiintific ca interventia este una eficienta; (b) implementarea serviciului este una standard, pentru a permite asiguratorului sa traga la raspundere specialistii care deviaza nejustificat de la protocolul de implementare 2 3 informatii si resurse utile pentru practicienii care utilizeaza EBP Daca ar fi sa ne referim la cele trei brate ale modelului EBP (figura 2 1) vom constata adesea ca practicienilor le este cel mai greu sa intre in rolul de cercetator Atat din aceste considerente, cat si pentru faptul ca lucrarea de fata are drept obiectiv specific cercetarea psihologica, vom prezenta in cele ce urmeaza o serie de informatii si resurse utile pentru practicieni Rolul acestora este de a facilita implementarea modelului EBP in practica profesionala curenta Mai specific, vom urmari sa oferim informatii in legatura cu trei intrebari (aspecte) cheie din procesul EBP: (a) "ce surse de informare ar trebui accesate pentru a investiga care sunt interventiile validate stiintific pentru o anumita problema psihologica?"; (b) "cat de valide sunt informatiile respective cat de mult ne putem increde in ele?"; (c) "ce criterii ar trebui indeplinite ca un serviciu psihologic sa fie considerat ca fiind validat stiintific?" 2 3 1 Surse de informare utile pentru practicieni in urma exploziei de informatii din era tehnologica, unui specialist in psihologie ii este tot mai greu sa parcurga toate studiile de specialitate dintr-un anumit domeniu Pe langa resursa de timp implicata, se poate pune si problema costurilor, deoarece o parte insemnata din bazele de date relevante pentru psihologie sunt disponibile doar contra cost Luand in calcul motivele mentionate anterior, cel mai util pentru practicieni ar fi sa caute dovezi privind nivelul de validare stiintifica in arhiva de studii Cochrane Collaboration (1993), utila domeniilor din psihologie conexe stiintelor medicale (psihologie clinica, consiliere psihologica, psihoterapie), respectiv arhiva de studii Campbell Collaboration (2000), utila pentru domenii ale psihologiei conexe stiintelor sociale (psihologia educationala, psihologia juridica, psihologia comunitara, psihologia economica etc ) Recent, a fost gandita o asemenea baza de date si in domeniul resurselor umane (psihologia muncii si organizationala), insa demersul se afla abia la inceput, fiind greu de facut predictii cu privire la succesul acestei baze de date (SiOP SHRM CoUaboration, 2011) Spre deosebire de celelalte baze de date intalnite in domeniul cercetarii cum ar fi Psycinfo, iSi Web of Science etc , cele amintite mai sus sunt axate pe sinteze de studii cu nivel ridicat de validitate stiintifica (metaanalize de studii experimentale sau cvasiexperimentale; sinteze narative) si au o arie de adresabilitate extinsa (inclusiv practicienii cu un nivel mai scazut de expertiza stiintifica), prin includerea de rezumate scrise intr-un limbaj netehnic De asemenea, accesul la consultarea sintezelor este liber (in regim gratuit) , oferind practicienilor o resursa serioasa spre consultare, in demersul de rezolvare a problemelor intalnite in practica lor profesionala O selectie a tematicilor abordate in cele doua baze de date de traditie (Cochrane si Campbell) este prezentata in caseta 2 2 Caseta 2 2 Exemple de tematici abordate in cele doua baze de date Exemple de sinteze disponibile in arhiva Cochrane CoUaboration 1 interventii eficiente in comunicarea catre adolescenti si copii a diagnosticului de cancer acordat unui alt membru al familiei 2 Eficienta programelor de prevenire a fumatului derulate in scoala 3 Eficienta terapiei de cuplu in combaterea depresiei 4 Eficienta terapiei prin realitate virtuala la pacientii care au suferit un atac vascular cerebral 5 interventii cognitiv-comportamentale pentru prevenirea aderarii copiilor si adolescentilor la gangs (grupuri de tineri cu potential infractional ridicat) Exemple de sinteze disponibile in arhiva Campbell CoUaboration 1 Strategii eficiente de managementul clasei de elevi pentru reducerea comportamentelor agresive si de indisciplina ale elevilor 2 Eficienta programelor de training adresate parintilor cu copii diagnosticati cu ADHD 3 Efectul programelor de tip afterschool asupra elevilor 4 Eficienta interventiilor de prevenire a accidentelor de la locul de munca 5 Eficienta programelor de prevenire a abuzului sexual Numarul de sinteze disponibile este impresionant, indeosebi a celor existente in arhiva Cochrane Collaboration Cu toate ca accesul la aceasta arhiva din Romania este gratuit doar pentru rezumate, acestea sunt scrise intr-un limbaj accesibil si prezinta informatii relevante care permit luarea unor decizii intemeiate pe studii validate stiintific Asemenea informatii sunt incomparabil mai valoroase (mai valide stiintific), decat daca ne-am raporta la opiniile prezentate in cadrul unor forumuri de specialitate sau la analiza unui singur studiu empiric de specialitate Caseta 2 3 Una din cele aproximativ 6 000 de sinteze disponibile in arhiva Cochrane Eficienta usturoiului in tratarea racelilor (Lissiman, Bhasale si Cohen, 2009) La nivel popular, usturoiul este perceput ca un tratament eficient in prevenirea si tratarea racelilor, probabil datorita studiilor de laborator care au aratat ca usturoiul are proprietati antivirale si antibacteriene in analiza am cautat studii care sa utilizeze usturoiul in prevenirea sau combaterea racelii Au fost identificate cinci studii, insa numai unul (N = 146 persoane) indeplineste criteriile pentru a fi inclus in analiza, fiind un studiu randomizat controlat Rezultate: cei care au consumat zilnic usturoi timp de trei luni de zile au avut un numar semnificativ statistic mai mic de raceli in comparatie cu cei alocati in grupul placebo in cazul participantilor care au racit, nu au existat diferente semnificative cu privire la durata episodului de raceala (4,63, respectiv 5,63 zile) Desi rezultatul acestui studiu sprijina ideea rolului benefic al usturoiului in prevenirea aparitiei racelilor, ar fi nevoie de mai multe studii randomizate pentru a replica rezultatele obtinute Posibilele efecte secundare in acest studiu se refera la miros si la unele iritatii ale pielii Studii suplimentare sunt necesare pentru a evidentia clar efectele secundare in urma consumului de usturoi Desigur, chiar daca in cele doua baze de date cu traditie exista un numar mare de sinteze este foarte posibil ca acestea sa nu acopere toate posibilele probleme cu care se confrunta un practician O alternativa utila in acest caz, dar cu aplicabilitate restransa doar la domeniul psihoterapiei, este consultarea listei de interventii validate stiintific Aceasta este actualizata periodic de un comitet din cadrul diviziei 12 a Asociatiei Psihologilor Americani Lista este disponibila spre consultare accesand linkul asociat referintei bibliografice mentionate (Chembless et al , 1996; 1998) in baza acestui demers, interventiile sunt grupate in doua mari categorii: interventii validate stiintific, respectiv interventii cu probabilitate ridicata de a fi valide stiintific Totusi, ar fi fost util sa se introduca si o a treia categorie, aceea a interventiilor despre care exista dovezi ca nu sunt valide stiintific in lipsa acestei categorii nu se poate distinge daca interventiile care nu sunt mentionate in cele doua categorii sunt omise pentru ca nu exista studii de validare (nu exista date) sau pentru ca exista studii, dar acestea un aratat ca terapia respectiva este ineficienta Un alt aspect important este faptul ca impartirea pe categorii se face in functie de problematica studiata, astfel incat este posibil ca aceeasi forma de psihoterapie sa fie eficienta pentru cazurile de bulimie, dar sa nu fie inclusa in lista interventiilor validate stiintific sau a celor care au o probabilitate ridicata de a fi validate stiintific pentru interventii in cazuri de alcoolism O alta resursa avuta la dispozitie de catre practicieni pentru a identifica interventii validate stiintific este apelul la baze de date internationale academice, precum Psyclnfo, ERiC, PubMed etc , o parte dintre acestea fiind gratuite Dezavantajul apelarii la aceste baze de date este faptul ca, in cele mai multe cazuri, accesul gratuit este asigurat doar pentru studiul rezumatelor Un alt neajuns este limbajul extrem de tehnic intalnit, ceea ce presupune cunostinte metodologice si statistice avansate (vezi capitolele 4-8) in sfarsit, o alta sursa de informare utila, mai ales pentru psihoterapeuti si psihologi clinicieni este apelul la ghiduri si recomandari de derulare a activitatii profesionale pentru o tematica anume Din acest punct de vedere, recomandarile NiCE (2005) (acronim al organizatiei britanice National institute for Health and Clinical Excellence) evidentiaza nivelul de incredere (validare stiintifica) in diferitele practici necesare in tratamentul unei probleme (de exemplu, recomandari pentru tratarea tulburarilor de comportament alimentar), dar si informatii cu privire la raportul cost-eficienta sau cost-utilitate al unei interventii care s-a dovedit a fi eficienta din punct de vedere clinic 2 3 2 informatii utile pentru evaluarea calitatii stiintifice a dovezilor existente in conceptia publicului larg, dar din pacate si a multor practicieni din domeniul psihologiei, cercetarile conduc la adevaruri absolute, de necontestat De aceea, frecvent in discursul argumentativ al multor persoane se face apel la rezultatele unor cercetari ce sprijina punctul lor de vedere in realitate, lucrurile nu stau deloc asa Orice studiu, oricat de bine ar fi fost intocmit, are o serie de limite De aceea este necesar sa trecem prin filtrul gandirii critice rezultatele oricarui studiu Mai mult, studiile difera la nivelul validitatii concluziilor extrase din ele, cu alte cuvinte au niveluri diferite de validare stiintifica Desi au fost dezvoltate mai multe variante ale piramidei increderii in dovezile empirice rezultate din studii (cea mai cunoscuta fiind dezvoltata de Sackett et al , 2000), in cele ce urmeaza este prezentata o versiune proprie privind ierarhizarea dovezilor din perspectiva calitatii lor si a nivelului de incredere avut in rezultatele studiului ’ Am ales aceasta varianta pentru a integra informatiile specifice legate de tipuri de cercetari, multe dintre ele fiind prezentate detaliat incepand cu capitolul 4 Figura 2 3 Piramida increderii privind eficienta unei interventii psihologice in functie de calitatea metodologica a studiilor pe care se bazeaza Cum se interpreteaza un asemenea grafic? in primul rand, orice consumator al literaturii de specialitate ar putea sa inteleaga faptul ca nivelul de incredere in concluziile unui studiu este mai ridicat atunci cand exista dovezi stiintifice solide Dovezile sunt mai bune in cazul rezultatelor obtinute din studii aflate in partea superioara a piramidei (mai apropiate de varful piramidei) Sa luam exemplul ipotetic a unui specialist din domeniul psihologiei educationale care, in baza experientei acumulate (observatii si reflectii personale), si-ar forma opinia ca stima de sine influenteaza nivelul epuizarii emotionale a profesorilor (burnout), in sensul ca un nivel scazut al stimei de sine la profesori conduce la intensificarea simptomatologiei asociate starii de epuizare emotionala a acestora O asemenea opinie, daca nu este sprijinita de date provenite din studii de specialitate ramane la un nivel scazut de incredere (nivelul 1 - nivelul bazal din piramida), lipsind dovezile care sa o sustina Chiar daca ar exista unele dovezi stiintifice, cum ar fi cazul unui studiu corelational (nivelul 3 din piramida - studii non-experimentale transversale), existenta unei corelatii negative semnificative statistic intre stima de sine si nivelul de burnout nu constituie o dovada stiintifica suficienta pentru a afirma ca stima de sine influenteaza nivelul epuizarii emotionale, pentru ca o asemenea afirmatie specifica explicit existenta unei relatii de tip cauza-efect Se stie insa ca relatia de cauzalitate este numai una dintre variantele care poate conduce la o asociere semnificativa intre cele doua variabile De exemplu, este posibil ca atat stima de sine scazuta, cat si epuizarea emotionala, sa fie amandoua consecinte ale unui leadership autoritar din partea conducerii scolii, orientat spre evidentierea neregulilor corpului profesional (fara componenta feedbackului pozitiv) Acelasi tip de relatie poate fi pus pe seama altor variabile care ar putea juca un rol de tip cauza Astfel, nivelul scazut de autoeficacitate didactica ar insemna o incredere scazuta a profesorului in capacitatea sa de a face fata la provocarile profesiei de dascal Ar fi firesc, in aceste conditii, ca acei profesori cu un nivel scazut al autoeficacitatii didactice sa manifeste niveluri mai scazute ale stimei de sine si un nivel mai ridicat de epuizare emotionala O alta ipoteza plauzibila pentru a explica rezultatul semnificativ statistic obtinut in studiul corelational ar fi chiar una opusa, cu privire la directia relatiei cauzale Astfel, nu ar fi de exclus ipoteza ca epuizarea emotionala este sursa unui nivel mai scazut al stimei de sine De pilda, intr-un context economic marcat de criza, in care exista o lipsa acuta de locuri de munca vacante este posibil ca cineva care manifesta un nivel ridicat de epuizare emotionala sa-si doreasca sa caute un alt loc de munca, dar sa aiba dificultati in gasirea unui alt loc mai bun Aceasta stare de blocaj s-ar putea rasfrange in timp asupra nivelului stimei de sine Pe scurt, toate aceste alternative explicative subliniaza ideea ca studiile corelationale pot valida doar afirmatii ce indica ideea asocierii (exista o corelatie negativa intre stima de sine si nivelul epuizarii emotionale), insa nu pot conduce la afirmatii valide cu privire la sursa (explicatia) acestei asocieri etc Aceasta situatie se rasfrange inclusiv la nivelul solutiilor (interventiilor propuse) in lipsa unor dovezi stiintifice suficiente care sa ateste relatia de tip cauza-efect dintre stima de sine si nivelul epuizarii emotionale este considerat inoportun sa se implementeze un program de intarire a stimei de sine cu scopul de a reduce nivelul epuizarii emotionale Un pas suplimentar in discutarea relatiilor de tip cauza-efect il constituie studiile non-experimentale longitudinale (derulate pe o perioada mai lunga de timp) in exemplul dat se poate institui drept criteriu de intrare masurarea nivelului epuizarii emotionale la momentul initial (T0) Cei care obtin valori ridicate (ce indica prezenta epuizarii emotionale) sunt exclusi din studiu Astfel, la inceputul studiului, totii participantii sunt incadrati in categoria celor care nu sunt epuizati emotional insa acest nivel al epuizarii emotionale este masurat repetat, la diferite intervale de timp, si se poate vedea astfel in ce masura nivelul stimei de sine de la momentul anterior (de exemplu, T0) prezice daca persoana este epuizata emotional la urmatoarea testare (de exemplu, T1) sau mai ales in ce masura modificari ale nivelului stimei de sine dintre momentele T0 si T1 preceda modificari ale nivelului epuizarii emotionale intre momentele T1 si T2 Chiar daca este vorba tot de un studiu non-experimental, designul longitudinal permite, intre anumite limite importante, investigarea relatiilor de tip cauza-efect, deoarece am putea examina daca modificarile privind epuizarea emotionala (efectul) sunt precedate de modificari ale nivelului stimei de sine (cauza potentiala) Acest lucru este posibil deoarece una dintre conditiile demonstrarii unei relatii de tip cauza-efect este aceea ca modificarile la nivelul variabilei cauza sa preceada modificarile la nivelul variabilei efect O situatie inversa, in care mai intai ar aparea modificari la nivelul variabilei efect, ar fi o dovada clara ca relatia cauza-efect propusa nu se sustine (nu este validata empiric) insa, demonstrarea antecedentei temporale a variabilei cauza fata de variabila-efect, desi este o conditie necesara, ea nu este si una suficienta pentru a demonstra existenta unei relatii de tip cauza-efect Revenind la exemplul dat, este posibil ca alte variabile straine sa fie responsabile pentru variatii ale nivelului epuizarii emotionale de la nivelul T1 la nivelul T2 De exemplu, pot exista si alte variabile alternative (nivelul de autoeficacitate didactica, nivelul angajamentului organizational etc ) care sa se modifice intre momentele T0 si T1 De asemenea, pot aparea unele evenimente importante intre momentele testarii care sa fie responsabile pentru modificari la nivelul epuizarii emotionale De exemplu, desi modificarile de la momentul T1 la momentul T2 sunt precedate de modificari ale stimei de sine de la momentul T0 la nivelul T1 este posibil sa apara un eveniment deosebit intre momentele T1 si T2 (cum ar fi o lege de diminuare a salariului pentru personalul bugetar cu 25%) care sa fie cauza reala a modificarilor observate cu privire la epuizarea emotionala De aceea, studiile non-experimentale longitudinale, desi constituie un pas suplimentar fata de studiile non-experimentale transversale in privinta dovezilor referitoare la o presupusa relatie de tip cauza-efect, nu au acelasi nivel de validitate privind detectarea unei relatii de tip cauza-efect precum cel intalnit in studiile experimentale, deoarece exista un control redus asupra variabilelor straine care ar putea afecta concluziile studiului in schimb, dovezile obtinute din studiile experimentale sunt cele mai solide pentru a evidentia o posibila relatie de tip cauza-efect deoarece, prin specificul lor, exercita cel mai bun control asupra variabilelor straine, care ar putea afecta concluziile unui studiu in capitolul 4 sunt detaliate diferentele dintre diferitele tipuri de studii experimentale sau cvasiexperimentale, precum si limitele derivate din specificul fiecaruia, iar in capitolul 5 sunt oferite detalii despre diferitele tipuri de studii non-experimentale O scurta descriere a fiecarui tip de studiu inclus in piramida (figura 2 3) este prezentata in tabelul 2 4 Exceptie face cazul opiniilor situate la baza piramidei, acestea nefiind studii efective, ci impresii subiective, formate in timp in baza unui amalgam de experiente personale si de informatii disparate provenite din studii Tabelul 2 4 Descrierea succinta a principalelor tipuri de studii de interes pentru practicienii adepti ai abordarii EBP Denumire Descriere succinta Observatii Studii de caz Analiza intensiva a unei unitati (de exemplu, individ, grup, Detalii in David organizatie) utilizate, fie cu scopul de a genera sau testa ipoteze (2006), Virga (experimente pe un singur subiect), fie de a descrie (ilustra) (2007) si in impactul unei anumite teorii asupra unei situatii particulare, sectiunea 5 1 contextuale (asupra unui individ) Studii non-experimentale transversale Este cea mai intalnita si mai variata categorie de studii Acestea Detalii in capitolul pot fi impartite in studii descriptive si in studii analitice 5, destinat studiilor (corelationale, comparative, metodologice) Toate au ca non-experimentale element comun faptul ca datele sunt colectate in aceeasi unitate de timp si ca nu exista o manipulare a variabilelor din partea cercetatorului De aceea ele sunt cunoscute si sub denumirea de studii observationale Studii non-experimentale longitudinale Este o categorie aparte de studii observationale, cu deosebirea ca datele sunt colectate in baza unor masuratori repetate pe acelasi lot de persoane, intinse pe o perioada mai indelungata de timp Fiind analizate aceleasi persoane exista un control mai bun asupra variabilelor straine decat in cazul studiilor transversale (sunt eliminate diferentele interindividuale) Metaanaliza pe studii non-experimentale Consta intr-o analiza sistematica a studiilor anterioare de tip Detalii in capitolul non-experimental Principalul scop al metaanalizei este de a 7, destinat studiilor sintetiza rezultatele obtinute intr-un domeniu, atat pentru a metaanalitice reflecta situatia globala (in cazul in care studiile incluse prezinta rezultate contradictorii), cat si pentru a surprinde acele variabile moderatoare care prezic variatii ale efectelor observate Desi are avantajul cumularii studiilor, rezultatele obtinute raman tributare limitelor studiilor non-experimentale incluse in analiza Studii Acest gen de studii implica manipularea variabilei Detalii in capitolul cvasiexperimentale independente (Vi) pentru a masura impactul acesteia asupra variabilei dependente, insa grupurile comparate nu sunt formate 4, destinat studiilor experimentale si prin alocarea randomizata a participantilor, fapt care afecteaza celor calitatea controlului exercitat asupra variabilelor straine cvasiexperimentale Studii experimentale pragmatice Acestea indeplinesc ambele cerinte necesare pentru un studiu experimental: manipularea Vi si randomizarea participantilor in grupele experimentale Totusi, unele variabile pot influenta rezultatele studiului, nefiind exercitat in mod deliberat un control strict asupra altor variabile pentru a vedea daca efectul anticipat se manifesta in conditiile naturale normale (de exemplu, criterii mai permisive de includere a participantilor in studiu, importanta scazuta acordata standardizarii interventiei etc ) Studii experimentale cauzal-descriptive Acestea solicita un control strict al tuturor variabilelor care ar putea afecta concluziile studiului, fiind un design mai strict comparativ cu cel intalnit in studiile pragmatice Pe de alta parte, doar pe baza acestui tip de design se poate dovedi clar existenta unei relatii de tip cauza-efect Studii experimentale asupra mecanismelor schimbarii Desi este important sa se demonstreze clar relatia de tip cauza-efect (de exemplu, ca terapia familial-sistemica este eficienta pentru a imbunatati satisfactia maritala), ar fi poate mai important sa identificam ce anume din cadrul interventiei a condus la cresterea satisfactiei maritale, mai exact care au fost cauzele (mecanismele schimbarii) Daca se cunoaste acest lucru pot fi optimizate ulterior interventiile pentru a maximiza efectul dorit Metaanaliza pe studii experimentale Consta in analiza sistematica a studiilor anterioare de tip Detalii in capitolul experimental (eventual si a celor de tip cvasiexperimental) 7, destinat studiilor Rezultatele acestui tip de studii constituie cele mai solide metaanalitice dovezi stiintifice pentru ca beneficiaza atat de avantajele criteriului cantitativ (analiza mai multor studii), cat si de cele ale criteriului calitativ (fiind incluse doar studii experimentale, acestea avand cel mai scazut risc de a conduce la concluzii distorsionate) Un alt mod de a ne raporta la piramida exprimata in figura 2 3 este ca, din punct de vedere cantitativ, cele mai multe dovezi provin din partea de jos a piramidei Din pacate, opiniile sunt cele mai frecvent intalnite in practica de zi cu zi De regula exista mult mai multe opinii si studii de tip non-experimental referitoare la o problema decat exista studii de tip experimental pe aceeasi problematica De aceea, cu cat se urca spre varful piramidei exista tot mai putine studii disponibile Se pot detecta mai multe motive pentru aceasta stare de fapt, dintre care doua sunt cel mai frecvent intalnite Primul motiv ar fi acela ca studiile de tip experimental sunt studii care se fac pe probleme "mature", adica asupra unor subiecte despre care exista deja suficienta informatie stiintifica provenita din studii non-experimentale Deoarece studiile experimentale necesita multe resurse logistice, nu ar fi normal, de exemplu, sa se deruleze un studiu experimental care sa urmareasca efectul terapiei rational emotive (REBT) asupra anxietatii sociale, inainte de a exista dovezi ca exista o corelatie intre nivelul anxietatii sociale si nivelul cognitiilor irationale (acestea fiind tinta directa a modificarilor prin intermediul REBT) Cel de-al doilea motiv este de ordin etic Pentru a derula studii experimentale sau cvasiexperimentale este necesar sa se realizeze o manipulare a variabilei independente de catre cercetator, insa acest lucru nu este intotdeauna posibil din motive etice Astfel, nu ar fi acceptabil sa facem un experiment cu privire la impactul abuzului emotional exercitat asupra partenerului de cuplu asupra nivelului de depresie Ceea ce putem face in acest caz este sa ne bazam pe studii de tip non-experimental pentru ca nu ar fi etic sa impartim randomizat participantii in doua grupe, una experimentala si una de control, iar celor din grupa experimentala sa le solicitam (sa-i incurajam) sa manifeste comportamente abuzive din punct de vedere emotional Pentru a complica si mai mult lucrurile legate de nivelul de incredere in rezultatele diferitelor studii, se cuvine sa precizam ca pot exista diferente calitative inclusiv intre studiile aflate in aceeasi categorie (pe aceeasi treapta) din piramida De exemplu, in cazul studiilor randomizate de tip descriptiv-cauzal (efficacy studies) pot exista diferente, de exemplu, in functie de caracteristicile grupului de control Astfel, in general se acorda o mai mare incredere in rezultatele studiilor daca grupul experimental este comparat cu un grup de control care primeste un tratament de tip placebo , decat daca grupul experimental este comparat cu un grup de control care momentan nu primeste vreun tratament, fiind pe lista de asteptare (waiting list) Acest lucru se intampla deoarece in primul caz putem distinge clar cat din efectul observat se datoreaza interventiei si cat este doar efect placebo , pe cand in cel de-al doilea caz nu este foarte clar daca eventualele diferente observate sunt cauzate de interventia in sine sau de efectul placebo (vezi de asemenea efectul Hawthorne) De aceea, pentru a surprinde si diferente calitative dintre studii, altele decat cele obtinute prin raportarea la piramida calitatii dovezilor stiintifice, au fost instituite unele grile de evaluare a calitatii dovezilor stiintifice care sa includa si alte criterii de analiza Una dintre cele mai raspandite grile de evaluare de acest gen este sistemul GRADE (Atkins et al , 2004; Balshem et al , 2011; Guyatt et al , 2011) care include, pe langa (a) designul studiului ce se regaseste si in piramida calitatii dovezilor stiintifice, informatii despre: (b) calitatea studiilor; (c) consistenta rezultatelor; (d) similaritatea studiilor cu situatia practica de rezolvat in baza datelor referitoare la design, la calitatea studiilor, la robustetea si omogenitatea efectelor si la gradul de aplicabilitate a acestora la situatia practica intalnita, sistemul GRADE clasifica interventiile in patru categorii diferite, din perspectiva gradului de incredere ca acestea vor functiona pentru situatia practica intalnita (caseta 2 4) Caseta 2 4 Principalele atribute ale sistemului GRADE (Balshem et al , 2011) Niveluri de incredere in reusita interventiei (punctaj intre paranteze): • ridicat (4) - probabilitate scazuta ca studii viitoare sa conduca la modificarea increderii in eficienta interventiei; • moderat (3) - studii viitoare pot avea un impact relevant pentru concluziile referitoare la eficienta interventiei; • scazut (2) - probabilitate ridicata ca studiile viitoare sa aiba impact important asupra concluziilor, fiind posibil sa asistam la situatia inversarii directiei efectului; • foarte scazut (1) - orice directie a efectului este posibila Scoruri de pornire initiala: • dovezi obtinute in baza unor studii experimentale - 4; • dovezi obtinute in baza unor studii non-experimentale (observationale) sau cvasiexperimentale - 2; • dovezi bazate pe opinii - 1 Aceste punctaje sunt ajustate dupa cum urmeaza: Scaderi de punctaj • -1 sau -2 puncte pentru calitatea scazuta a studiilor sub standardul implicat de designul respectiv; • -1 pentru numar mic de studii sau pentru cazul in care se observa efecte eterogene (variatii mari); • -1 sau -2 puncte penalizare pentru studiile care au putine similitudini cu grupul-tinta vizat in practica; • -1 pentru situatii de prezentare trunchiata a rezultatelor (reporting bias) Cresteri de punctaj • +1 daca variabilele straine necontrolate ar fi putut afecta datele doar in directia reducerii efectului; • +1 daca este manipulata Vi (studii cvasiexperimentale); • +1 sau +2 daca exista asocieri puternice intre variabile (risc relativ dublu, Cohen d cu aproximatie de 0,40), respectiv foarte puternice (risc relativ de 5 ori mai mare mai mic, Cohen d aproximativ 0,90) Avantajul utilizarii GRADE este acela ca, in anumite cazuri, informatii pozitionate inferior pe scala calitatii dovezilor din perspectiva designului pot fi considerate mai utile decat cele situate pe pozitii superioare Un astfel de exemplu, ar fi cazul compararii a doua forme de psihoterapie A si В pentru combaterea depresiei majore la varsinici interventia A este considerata mai potrivita de utilizat (daca ea se bazeaza pe eficienta observata in doua studii de tip cvasiexperimental, ambele efectuate pe o populatie similara ca varsta si din punct de vedere cultural si in conditiile in care se observa efecte omogene si robuste), decat terapia В (pentru care exista dovezi privind eficienta acesteia intr-un studiu experimental pragmatic, dar efectuat pe o populatie diferita, de exemplu, pe tineri delincventi) Utilizarea sistemului GRADE, desi nu specifica explicit ce inseamna o interventie validata stiintific, constituie un reper util pentru practicieni, fiind indicat sa se apeleze doar la interventii catalogate ca avand un nivel de incredere ridicat sau unul moderat 2 3 3 Dovezi stiintifice minimale pentru a considera o interventie drept validata stiintific in urma cautarii informatiilor relevante din literatura de specialitate si a analizei critice privind calitatea si relevanta lor pentru problema investigata, se cuvine sa precizam niste standarde (benchmarks) pentru a considera o anumita interventie din domeniul psihologiei, ca fiind validata stiintific Asociatia Psihologilor Americani (APA), prin divizia de Psihologie Clinica si Psihoterapie (vezi Chambless et al , 1996, 1998 sau Chambless si Hollon, 1998) propune asemenea repere pentru segmentul de interventii terapeutice Conform acestei propuneri, exista doua categorii acceptabile de interventii terapeutice validate stiintific: interventii a caror eficienta este clar demonstrata, respectiv interventii probabil eficiente Aceste repere constituie o pozitie oficiala pentru domeniul psihoterapiei, fiind la baza alcatuirii listei de interventii validate stiintific realizata si actualizata periodic de catre specialistii APA Caseta 2 5 Criterii minimale pentru interventiile validate stiintific interventii eficiente (well-established treatment): 1 cel putin doua studii experimentale de tip cauzal-descriptiv (efficacy studies) in care sa fie demonstrata eficienta interventiei in unul sau mai multe dintre urmatoarele moduri: a) interventia este superioara unei interventii psihologice de tip placebo sau unei alte interventii psihoterapeutice sau din zona farmacoterapiei; b) interventia este echivalenta unei alte interventii psihoterapeutice a carei validitate a fost demonstrata anterior, in cadrul unor studii care au o putere statistica adecvata (de exemplu, cel putin 30 de persoane per grup experimental); sau 2 un numar mare (n > 9) de experimente pe un singur participant (single-case experiments) in care s-a constatat ca interventia este una eficienta, utilizand un design experimental adecvat si respectand criteriul 1 a Conditii suplimentare solicitate atat pentru cazul 1, cat si pentru cazul 2: 3 interventiile sa fie implementate in baza unui manual (sa fie standardizate); 4 criteriile de includere (excludere) a participantilor in studiu sa fie explicitate, astfel incat sa fie clare caracteristicile participantilor; 5 eficienta interventiei sa fie demonstrata de cel putin doi cercetatori diferiti (echipe de cercetare diferite) interventii probabil eficiente: 1 doua studii experimentale in care se demonstreaza ca interventia este eficienta comparativ cu un grup de control tip lista de asteptare (care nu beneficiaza momentan de niciun fel de interventie); sau 2 un studiu experimental care indeplineste criteriile 1, 3 si 4 mentionate in categoria interventiilor eficiente; sau 3 un numar mai redus de experimente pe un singur subiect (n > 3) derulate cu respectarea criteriilor 2, 3 si 4 mentionate in categoria interventiilor eficiente Nota: Evaluarea se face separat pentru fiecare tip de problema in parte Spre exemplu, unele interventii pot fi considerate eficiente pentru tratarea depresiei majore, pot fi probabil eficiente pentru tratarea anxietatii sociale si pot fi chiar ineficiente (sau pot lipsi dovezi suficiente legate de eficienta lor) pentru tratarea atacurilor de panica De-a lungul timpului au fost dezvoltate mai multe asemenea criterii minimale (vezi lista lor in Chambless si Ollendick, 2001 sau in Kratochwill si Stoiber, 2002) La acestea as adauga contributia recenta adusa de profesorul clujean Daniel David impreuna cu cercetatorul american Guy Montgomery Acestia propun o alta grila pentru incadrarea interventiilor in categoria celor validate stiintific, punand accent nu numai pe eficienta unei interventii anume, ci si pe existenta unor dovezi privind mecanismele cauzale responsabile pentru aceasta schimbare (David si Montgomery, 2011) Cei doi autori au pornit in demersul lor de la: (a) problema existentei multiplelor cadre de referinta existente pentru a incadra o interventie ca fiind validata stiintific, ceea ce conduce la situatia neplacuta ca anumite interventii psihoterapeutice sa fie considerate validate stiintific dupa anumite criterii, dar nu si dupa altele si (b) problema accentului excesiv pus pe eficienta interventiei cu neglijarea cadrului teoretic in consecinta, cei doi autori propun sa se diferentieze intre interventiile psihoterapeutice nu numai in functie de eficienta lor, ci si in functie de fundamentarea stiintifica a teoriei de la baza lor Astfel, David si Montgomery (2011) propun un sistem de evaluare format din noua clase (categorii) de interventii psihoterapeutice rezultate din intersectarea a doua criterii majore, fiecare cu cate trei niveluri de raportare Cele doua criterii sunt: eficienta terapeutica (1 - efecte benefice; 2 - rezultate neclare contradictorii nedovedite; 3 - efecte absente adverse); respectiv fundamentarea teoretica a interventiei (mecanismele cauzale implicate) (1 -dovezi clare; 2 - dovezi inconcludente contradictorii absenta testarii; 3 -dovezi care contrazic clar modelul teoretic teorii pseudostiintifice, ce nu pot fi infirmate) Cele noua categorii sunt prezentate in figura 2 4 Dintre acestea, cinci categorii (clase) sunt considerate ca fiind invalide din punct de vedere stiintific pentru ca, fie exista dovezi privind lipsa lor de eficienta terapeutica, fie se bazeaza pe teorii invalidate, fie au ambele neajunsuri mentionate (cum ar fi cazul interventiilor incluse in clasa 9) Se considera ca exista dovezi despre o anumita tehnica daca exista rezultate similare obtinute din cel putin doua studii experimentale efectuate de cercetatori sau echipe de cercetare diferite Desigur, ideal pentru orice interventie terapeutica ar fi sa ajunga sa fie incadrata in prima clasa, aceea a interventiilor pentru care exista dovezi, atat cu privire la eficienta lor, cat si cu privire la cauzele (teoria) pentru care acestea sunt eficiente, prin identificarea mecanismelor schimbarii Pentru ca eficienta sa fie demonstrata este nevoie ca dovezile sa provina din cel putin doua studii experimentale, efectuate de cercetatori sau echipe de cercetare diferite De remarcat, de asemenea, ca orice interventie noua (cu exceptia cazului cand este fundamentata pe teorii invalidate stiintific sau pe modele pseudostiintifice), este incadrata pentru inceput in clasa 4, destinata interventiilor pentru care inca nu exista suficiente dovezi privind eficienta lor si mecanismele cauzale implicate, dar care se bazeaza pe modele teoretice generale pentru care exista suport stiintific Eficienta demonstrata Rezultate contradictorii, eterogene lipsa informatii Eficienta absenta efecte adverse prezente Mecanism cauzal informatii sustinut insuficiente Clasa 1 Clasa 2 Clasa 3 Clasa 4 Clasa 6 Clasa 8 Mecanism cauzal respins imposibil de testat Clasa 5 Clasa 7 Clasa 9 Figura 2 4 Clasificarea interventiilor dupa David si Montgomery (2011), adaptare Desi cele mai multe demersuri de evaluare a interventiilor apartin domeniul psihologiei clinice si psihoterapiei, trebuie mentionat ca demersuri similare au fost efectuate si in alte domenii aplicative ale psihologiei De exemplu, Diviza 16 a APA a propus un sistem de lucru pentru stabilirea eficientei interventiilor din domeniul psihologiei scolare (Kratochwill si Stoiber, 2002) Acesta este probabil cel mai comprehensiv sistem de evaluare (de exemplu, manualul de codare are nu mai putin de 134 de pagini - pentru detalii, vezi Kratochwill, 2012), insa tocmai din cauza acestei complexitati sporite este putin probabil sa fie adoptat in practica profesionala in schimb, sistemul este foarte util pentru cercetatorii interesati sa stabileasca nivelul de validare stiintifica pentru diferitele interventii din domeniul educational si pentru practicienii interesati de a avea o imagine de ansamblu (in scop educational) cu privire la detaliile implicate intr-o abordare de tip practician-cercetator (scientist-practitioner) Acest model complex cuprinde, pe langa caracteristicile precizate pentru aria psihologiei clinice (accentul pus pe evaluarea eficientei unei interventii din perspectiva validitatii interne a studiilor), atat criterii ce tin de validitatea externa a rezultatelor (similaritate culturala, de varsta etc ), cat si aspecte ce vizeaza validitatea de construct si validitatea statistica a studiilor (detalii despre tipurile de validitate sunt prezentate in capitolul urmator) O alta caracteristica specifica este includerea in procesul de evaluare a interventiilor in sprijinul carora datele provin din studii calitative Ca modalitate de punctare, fiecare aspect este evaluat utilizand un sistem de codare in patru puncte (3 - dovezi puternice; 2 - dovezi promitatoare; 1 -dovezi limitate [slabe]; 0 - absenta dovezilor) De exemplu, in evaluarea calitatii studiilor cu referire la grupele de control utilizate se acorda: 3 puncte pentru grupuri de control active formate prin randomizare (interventii alternative, placebo etc ); 2 puncte pentru grupuri de control pasive formate prin randomizare (lista de asteptare); 1 punct pentru grupuri de control formate fara randomizare (studii cvasiexperimentale), dar in care exista demonstrata echivalenta cu grupul experimental la nivel de pretest pentru variabilele de interes sau macar exista niveluri similare procentuale cu referire la retragerea din experiment si 0 puncte pentru situatia absentei unui grup de control sau pentru cazul unor grupuri de control pentru care nu s-a facut niciun efort de asigurare a echivalentei lor cu grupul experimental La ora actuala nu am cunostinta de existenta vreunui demers de clasificare a interventiilor in zona psihologiei muncii si organizationala, insa principiile mentionate pentru cazurile psihoterapiei sau psihologiei scolare pot fi extrapolate de catre practicienii interesati si pentru analiza interventiilor din domeniul organizational in schimb au fost formulate sugestii de clasificare a procesului de evaluare psihologica (toate celelalte clasificari mentionate referindu-se la partea de interventie psihologica) (Cohen et al , 2008) Criteriile de baza in zona evaluarii psihologice, asa cum era de asteptat, vizeaza in principal caracteristicile psihometrice ale metodei de evaluare (cel mai adesea un test psihologic) Caseta 2 5 Criterii utilizate pentru evaluarea instrumentelor psihologice din perspectiva EBP Metode solide (well-established assessment) 1 instrumentul este prezentat in cel putin doua articole de specialitate cu peer-review, de catre doi cercetatori sau doua echipe de cercetare diferite 2 Sunt prezentate detaliat informatii psihometrice care sa ateste ca metoda de evaluare are o buna validitate si fidelitate in cel putin un articol cu peer-review 3 La cerere sunt oferite informatii suplimentare (exista un manual) care sa prezinte alte informatii relevante, incat sa permita o evaluare critica a rezultatelor si implementarea standard a metodei Metode probabil eficiente 1 instrumentul este prezentat in cel putin doua articole de specialitate cu peer-review, de catre acelasi autor sau aceeasi echipa de cercetare 2 Sunt prezentate detaliat informatii psihometrice care sa ateste ca metoda de evaluare are o validitate si o fidelitate acceptabila in cel putin un articol cu peer-review 3 La cerere sunt oferite informatii suplimentare (exista un manual) care sa prezinte alte informatii relevante, incat sa permita o evaluare critica a rezultatelor si implementarea standard a metodei Metode promitatoare 1 instrumentul este prezentat intr-un singur articol de specialitate cu peer-review 2 Caracteristicile psihometrice associate metodei sunt bune sau cel putin adecvate 3 La cerere sunt oferite informatii suplimentare (exista un manual) care sa prezinte alte informatii relevante, incat sa permita o evaluare critica a rezultatelor si implementarea standard a metodei O clasificare oarecum similara a fost adoptata de Colegiul Psihologilor din Romania (Lita, Stan si Sava, 2008), conform careia se acorda: (a) aviz pe perioada nedeterminata (metode solide) acordat probelor care dovedesc existenta unui manual, dovezi numeroase si robuste privind caracteristicile psihometrice (validitate si fidelitate), precum si dovada adaptarii pe populatie romaneasca, inclusiv etaloane, daca este cazul; (b) sau aviz pe perioada determinata (metode probabil eficiente promitatoare) acordat probelor care dovedesc existenta unui manual, prezinta dovezi suficiente privind validitatea testului si acceptabile cu privire la fidelitate si etalonare si dovezi de adaptare pe populatie romaneasca, daca este cazul Probele care nu indeplinesc aceste criterii minimale sunt respinse de la avizare O lista a probelor psihologice avizate de catre Comisia de Metodologie a Colegiului Psihologilor din Romania (CPR) este disponibila la www copsi ro Din pacate nu au fost demarate asemenea demersuri de catre alte comisii aplicative ale CPR pentru a identifica interventiile validate stiintific din diferite domenii de activitate, desi acest lucru ar fi putut fi facut, cel putin in domeniul psihologiei clinice, a consilierii psihologice si a psihoterapiei unde exista multa literatura specifica 2 3 4 Sugestii suplimentare privind luarea deciziei in practica EBP La finalul acestui proces laborios pe care ar trebui sa-l parcurga un practician adept al practicii EBP apare problema selectarii celei mai bune solutii de implementat in practica Sa ne reamintim ca in EBP trebuie sa se tina seama, pe langa identificarea unor interventii validate stiintific, si de caracteristicile clientului, precum si de nivelul de expertiza (existenta competentei necesare) a psihologului in a implementa solutia cea mai buna La aceasta se adauga resursele existente, fiind preferate solutiile care dovedesc ca sunt eficiente si fezabile de implementat, dar si care poseda un foarte bun raport cost-eficienta Desi decizia in sine tine de o abordare contextuala, ideografica, ar fi util ca orice practician sa raspunda la o serie de intrebari (vezi tabelul 2 5, o adaptare dupa modelul sugerat de Kratochwill si Shernoff, 2004), pentru a alege cea mai potrivita interventie pentru contextul respectiv Tabelul 2 5 Zece intrebari-cheie (filtru) in selectarea interventiilor psihologice Dimensiuni vizate Solutia Solutia Solutia 12 3 1 Clientul are caracteristici similare cu cele intalnite in solutiile identificate ca fiind validate stiintific? Caracteristici demografice - varsta, sex, nivel de educatie, spatiu cultural Solicitantul interventiei - clientul, parintele, angajatorul etc 2 Cat de complexa este interventia (de reproductibila)? Specifica - replicabila usor; complexa - reusita ei depinde de multi factori 3 Exista factori contextuali (organizationali) care pot interfera cu privire la reusita interventiei? Climat institutional si politici organizationale, sprijinul conducerii, perceptia beneficiarilor fata de solutia propusa 4 Exista expertiza necesara pentru implementarea solutiei? Certificari necesare, experienta anterioara 5 Exista acces la un manual sau macar la un ghid de implementare a interventiei? 6 Poate fi incadrata interventia in categoria celor validate stiintific? 7 Exista dovezi solide privind eficienta interventiei propuse? Efecte omogene si robuste (semnificative din punct de vedere clinic, practic) 8 interventia constituie un factor de risc pentru aparitia unor efecte secundare adverse (pot fi afectate alte aspecte importante pentru client)? 9 Exista indicatori obiectivi (operationalizabili) care sa monitorizeze eficienta interventiei, inainte de finalizarea ei? 10 interventia prezinta un bun raport cost-eficienta? De asemenea, in contextul decizional implicat, practicianul ar trebui sa fie atent sa nu se lase influentat de distorsiunile cognitive inerente situatiilor de decizie si de evaluare (monitorizare) a procesului de implementare Printre cele mai frecvente se regasesc: euristica de accesibilitate (indiferent de natura problemei alegem solutia la indemana, care a fost utilizata si cu alte ocazii sau cea in care avem cea mai mare experienta - "de ce nu incerci X, am obtinut multe rezultate bune"); euristica exemplului-cliseu (conturarea unui profil stereotipal - "va cunosc eu pe voi "astia", copiii strazii, la toti functioneaza metoda X"); biasul confirmarii (amintirea situatiilor care se pliaza pe teoria implicita construita despre problema clientului, cu scop asigurator ca lucrurile sunt pe o directie buna); apelul la explicatii post hoc (justificari aduse unor situatii aparute - "metoda functioneaza mai putin eficient acum decat in alte ocazii pentru ca au aparut unele circumstante agravante") in sfarsit, acolo unde este posibil ar trebui ca in implementarea interventiei selectate sa se tina cont de recomandarile existente in ghidurile de interventie (in cazul in care sunt elaborate asemenea documente) Aceasta este dovada finala care distinge la nivel aplicativ intre diferitele domenii de activitate O stiinta matura ar trebui sa se bazeze pe protocoale specifice de interventie si mai putin pe impresii personale si opinii despre cum ar trebui sa fie implementata o anumita interventie De altfel, in medicina acest aspect face de multe ori diferenta dintre praxis si malpraxis si este posibil ca, odata cu dezvoltarea mai multor ghiduri si protocoale de interventie, sa se ajunga la aceeasi stare de fapt si in psihologie Concluzii Conceptul practicii validate stiintific (EBP) cunoaste in ultimii 10 ani o dezvoltare deosebita, fiind introdus treptat in domenii aplicative variate (management, stiintele educatiei, politici publice, psihologie, stiinte medicale) ideea de baza este de a identifica si implementa in practica de zi cu zi acele interventii care s-au dovedit a fi validate stiintific Acceptarea acestora si increderea pe care o avem in eficienta lor este dependenta de calitatea dovezilor stiintifice existente, in baza studiilor empirice realizate Din acest punct de vedere, standardul spre care se tinde este acela de a obtine dovezi din studii randomizate (experimentale) si, indeosebi, din metaanalize care sintetizeaza rezultatele acestor studii experimentale EBP inseamna mai mult decat interventii validate stiintific implica, de asemenea, a tine cont de expertiza clinica a celui care implementeaza solutia si de caracteristicile specifice ale clientului caruia i se propune interventia respectiva Astfel, pe langa dimensiunea ce vizeaza eficienta interventiei, la fel de relevanta este si dimensiunea ce vizeaza utilitatea aplicativa (in sfera sanatatii se foloseste denumirea de utilitate clinica) Aceasta se refera la discutarea fezabilitatii, aplicabilitatii si a utilitatii (marimea efectului) unei interventii validate stiintific, vizand astfel aspecte ce tin de validitatea externa Adoptarea unui asemenea model profesionist din partea practicienilor, in ciuda unor inconveniente (necesita resurse de timp si un efort mai mare), va conduce la multiple beneficii pentru profesia de psiholog prin: (a) o mai mare responsabilizare in legatura cu actul profesional prin respectarea unor protocoale de interventie; (b) o crestere a calitatii serviciilor psihologice prin obtinerea de efecte pozitive mai intense in urma implementarii celor mai potrivite tehnici de interventie si prin eliminarea, in timp, a practicilor demodate care s-au dovedit a fi ineficiente; (c) dezvoltarea pregatirii profesionale a psihologilor prin aparitia de materiale educationale si comerciale diverse (manuale de interventie, casete video etc ) si dezvoltarea psihologiei ca stiinta, prin cresterea nivelului de alfabetism stiintific printre practicieni, ca o masura suplimentara menita sa reduca discursul de tip pseudostiintific din domeniul psihologiei Lecturi suplimentare Rob B Briner si Danise M Rousseau (2011) Evidence-based i-O psychology; Not there yet industrial and Organizational Psychology, 4, pp 3-22 Articolul prezinta starea de fapt cu privire la situatia practicii validate stiintific in domeniul psihologiei muncii si organizationala Bonnie Spring (2007) Evidence-based practice in clinical psychology: What it is, why it matters, what you need to know Journal of Clinical Psychology, 63, pp 611-631 Articolul are marea calitate de a prezenta intr-o maniera foarte structurata aspectele-cheie ale conceptului de EBP (istoric, definire, resurse) cu referire la domeniul psihologiei clinice si al psihoterapiei Cochrane Collaboration - www cochrane org Baza de date gratuita, al carei scop este de a colecta si evalua toate studiile randomizate din zona sanatatii cu scopul de a-i ajuta pe practicieni si pe cei care dezvolta politici in domeniul sanatatii sa ia deciziile cele mai bune La ora actuala sunt inregistrate peste 6 000 de evaluari De interes indeosebi pentru urmatoarele directii aplicative ale psihologiei: psihologie clinica, consiliere psihologica si psihoterapie Campbell Collaboration - www campbellcollaboration org Baza de date este inspirata dupa modelul de succes al Cochrane Collaboration, cu scopul de a colecta si evalua toate studiile de tip experimental sau cvasiexperimental din domenii variate ale stiintelor sociale Este vorba de interventii aplicate in domenii precum educatie, asistenta sociala, politici publice, justitie si criminalitate La ora actuala exista peste 200 de sinteze realizate De interes indeosebi pentru directiile aplicative: psihologie scolara, psihologie comunitara, psihologie juridica, psihologie economica, psihologie sociala aplicata Bibliografie APA (2012) Society for Clinical Psychology American Psychological Association Division 12 Disponibila la adresa http:  www div12 org PsychologicalTreatments faq html APA Presidential Task Force on Evidence-Based Practice (2006) Evidence-based practice in psychology American Psychologist, 61, pp 271-285 Atkins, D , Best, D , Briss, P A , Eccles, M , Falck-Ytter, Y , Flottorp, S , Guyatt, G H et al (2004) Grading quality of evidence and strength of recommendations British Medical Journal, 328 (7454), p 1490 Balshem, H , Helfand, M , Schunemann, H J , Oxman, A D , Kunz, R , Brozek, J , Vist, G E et al (2011) GRADE guidelines 3: rating the quality of evidence - introduction Journal of Clinical Epidemiology, 64, pp 401-406 Bennett, S , Tooth, L , McKenna, K , Rodger, S , Strong, J , Ziviani, J et al (2003) Perceptions of evidence-based practice: a survey of Australian occupational therapists Australian Occupational Therapy Journal, 50, pp 13-22 Birle, D (2010) implicatii psihologice ale alegerii carierei Teza de doctorat, Universitatea "Babes-Bolyai", Cluj-Napoca Briner, R B , Rousseau, D M (2011) Evidence-based i-O psychology: Not there yet industrial and Organizational Psychology, 4, pp 3-22 Campbell Collaboration (2000) The Campbell Collaboration What helps? What harms? Based on what evidence Disponibil la adresa: http:  www campbellcollaboration org Chambless, D L , Baker, M J , Baucom, D H , Beutler, L E , Calhoun, K S , Crits-Christoph, P , Daiuto, A et al (1998) Update on empirically validated therapies, ii Clinical Psychologist, 51, pp 3-16 Chambless, D L , Hollon, S D (1998) Defining empirically supported therapies Journal of Consulting and Clinical Psychology, 66, pp 7-18 Chambless, D L , Ollendick, T H (2001) Empirically supported psychological interventions: Controversies and evidence Annual Review of Psychology, 52, pp 685-716 Chambless, D L , Sanderson, W C , Shoham, V , Bennett Johnson, S , Pope, K S , Crits-Christoph, P , Baker, M et al (1996) An update on empirically validated therapies Clinical Psychologist, 49, pp 5-18 Cochrane Collaboration (1993) The Cochrane Collaboration Working together to provide best evidence for health care Disponibil la adresa: http:  www cochrane org Cohen, L L , La Greca, A M , Blount, R L , Kazak, A E , Holmbeck, G N , Lemanek, K L (2008) introduction to special issue: Evidence-based assessment in pediatric psychology Journal of pediatric psychology, 33, pp 911-915 Craig, J V , Smyth, R L (2002) The evidence-based practice manual for nurses New York: Elsevier Health Sciences David, D (2006) Metodologia cercetarii clinice iasi: Editura Polirom David, D , Montgomery, G H (2011) The scientific status of psychotherapies: A new evaluative framework for evidence-based psychosocial interventions Clinical Psychology: Science and Practice, 18, pp 89-99 Gaudiano, B A , Statler, M A (2001) The scientist practitioner gap and graduate education: integrating perspectives and looking forward The Clinical Psychologist, 54, pp 12-18 Gibbs, L (2002) Evidence-based practice for the helping professions Belmont, CA: Wadsworth Publishing, Thomson Higher Education Guyatt, G , Oxman, A D , Akl, E , Kunz, R , Vist, G , Brozek, J , Norris, S et al (2011) GRADE guidelines 1 introduction-GRADE evidence profiles and summary of findings tables Journal of Clinical Epidemiology, 64, pp 383-394 Humphris, D , Littlejohns, P , Victor, C , O'Halloran, P , Peacock, J (2000) implementing evidence based practice: factors that influence the use of research evidence by occupational therapists British Journal of Occupational Therapy, 63, pp 516-522 ig, R , Kwan, i (2008) School-based driver education for the prevention of traffic crashes The Cochrane Library, 4, disponibil la adresa: http:  www thecochranelibrary com Kratochwill, T R (2012) Task force on evidence-based interventions in school psychology Procedural and coding manual for review of evidence-based interventions Disponibil la adresa: http:  www indiana edu  ebi EBi-Manual pdf Kratochwill, T R , Shernoff, E S (2004) Evidence-based practice: promoting evidence-based interventions in school psychology School Psychology Review, 33, pp 34-48 Kratochwill, T R , Stoiber, K C (2002) Evidence-based interventions in school psychology: Conceptual foundations of the Procedural and Coding Manual of Division 16 and the Society for the Study of School Psychology Task Force School Psychology Quarterly, 17, pp 341-389 Ledford Jr, G E , Heneman iii, H G (2011) Skill-based pay The SiOP SHRM Library, disponibil la adresa: http:  www siop org siop-shrm default aspx Levant, R F , Hasan, N T (2008) Evidence-based practice in psychology Professional Psychology: Research and Practice, 39, pp 658-662 Lissiman, E , Bhasale, A L , Cohen, M (2009) Garlic for the common cold The Cochrane Library, disponibil la adresa: http:  www thecochranelibrary com Lita, S , Stan, A , Sava, F A (2008) The development and use of Romanian system for reviewing and certification of psychological tests Lucrare prezentata la cel de-al XXiX-lea Congres international de Psihologie, iulie 20-25, Berlin, Germania NiCE (2005) National institute for Health and Clinical Excellence Disponibil la adresa: http:  www nice org uk Noonan, E (2009) Evidence-based pedagogy The Campbell Library, disponibil la adresa: http:  www campbellcollaboration org Norcross, J C , Beutler, L E , Levant, R F (eds ) (2006) Evidence-based practices in mental health: Debate and dialogue on the fundamental questions APA, Washington, DC Overholser, J C (2010) Ten criteria to qualify as a scientist-practitioner in clinical psychology: An immodest proposal for objective standards Journal of Contemporary Psychotherapy, 40, pp 51-59 Peterson, K (2006) Practice-based primary care research-translating research into practice through advanced technology Family Practice, 23, pp 149-150 Petrosino, A , Turpin-Petrosino, C , Buehler, J (2009) "Scared straight" and other juvenile awareness programmes for preventing juvenile delinquency The Cochrane Library, disponibil la adresa: http:  www thecochranelibrary com Rousseau, D M (2006) is there such a thing as evidence-based management? Academy of Management Review, 31, pp 256-269 Rynes, S L , Giluk, T L , Brown, K G (2007) The very separate worlds of academic and practitioner periodicals in human resource management: implications for evidence-based management Academy of Management Journal, 50, pp 987-1008 Sackett, D L , Rosenberg, W M C , Gray, J A M , Haynes, R B , Richardson, W S (1996) Evidence based medicine: What it is and what it isn't British Medical Journal, 312, pp 71-72 Sackett, D L , Strauss, S E , Richardson, W S , Rosenberg, W , Haynes, R B (2000) Evidence-based medicine: How to practice and teach EBM (editia a il-a) New York: Churchill Livingstone Schneider, B , Barbera, K M (2011) Driving customer satisfaction through HR: creating and maintaining a service climate The SiOP SHRM Library, disponibil la adresa: http:  www siop org siop-shrm default aspx Seligman, M E P (1995) The effectiveness of psychotherapy The consumer reports study American Psychologist, 50, pp 965-974 Shernoff, E S , Kratochwill, T R , Stoiber, K C (2003) Training in evidence-based interventions (EBis): What are school psychology programs teaching? Journal of School Psychology, 41, pp 467-483 SiOP (2003) Principles for the validation and use of personnel selection procedures (editia a iV-a) Disponibil la adresa: http:  www siop org  Principles principles pdf SiOP SHRM Collaboration (2011) SiOP and SHRM: promoting evidence-based HR Disponibil la adresa http:  www siop org siop-shrm default aspx Spring, B (2007) Evidence-based practice in clinical psychology: What it is, why it matters, what you need to know Social Science Research, 63, pp 611-631 Stricker, G (1997) Are science and practice commensurable? American Psychologist, 52, pp 442-448 Virga, D (2007) Psihologie experimentala - de la teorie la practica Timisoara: Editura Universitatii de Vest Wikipedia (2012) List of academic databases and search engines Disponibil la adresa: http:  en wikipedia org wiki List of academic databases and search engines Wilson, J L , Armoutliev, E , Yakunina, E , Werth, J L (2009) Practicing psychologists' reflections on evidence-based practice in psychology Professional Psychology: Research and Practice, 40, pp 403-409 Wilson, S J , Tanner-Smith, E E , Lipsey, M W , Steinka-Fry, K , Morrison, J (2011) Dropout prevention and intervention programs: Effects on school completion and dropout among school-aged children and youth The Campbell Library, disponibil la adresa: http:  www campbellcollaboration org O alta traducere, ce va fi utilizata alternativ pentru EBP, este aceea de practica bazata pe dovezi empirice in acest sens ar merita analizate in contrast normativele practicii EBP cu situatia intalnita in multe cabinete de psihologia muncii si transporturilor din Romania Din nefericire, in cele mai multe cazuri, deciziile de acordare a avizului psihologic (apt inapt) au fost luate in baza unor metodologii lipsite complet de orice validare stiintifica (cu instrumente psihologice depasite si sau cu proprietati psihometrice discutabile; in absenta studiilor de validare a eficientei procesului de testare etc ) Aceste neajunsuri au condus in desuetudine practica din cabinetele de profil si a contribuit, alaturi de alti factori politici, la amendarea legii 355 din 2007 la finalul anului 2011, soldata cu eliminarea obligativitatii examinarii psihologice periodice in cele mai multe situatii Accesul este gratuit la sintezele din Campbell Collaboration, respectiv din SiOP SHRM Collaboration, atat pentru rezumate, cat si pentru rapoartele integrale Accesul la sintezele din Cochrane Collaboration este gratuit numai pentru rezumate Pentru rapoartele integrale accesul se face contra cost cu unele exceptii (gratuitate pentru utilizatorii din UK sau in baza unor donatii) Din punct de vedere istoric, arhiva Cochrane Collaboration a fost initiata in anul 1993, in UK (denumirea fiind data in cinstea lui Archie Cochrane [medic], care a fost primul cercetator care a atras atentia la inceputul anilor ’70 asupra unei probleme extinse, aceea de a utiliza in practica interventii despre care nu se stie nimic cu privire la nivelul lor de eficienta - cat de benefice sunt acestea) Arhiva Campbell Collaboration a fost demarata mai tarziu, in anul 2000, denumirea fiind data in cinstea psihologului Donald Campbell care a avut contributii importante metodologice, in special in identificarea distorsiunilor care pot afecta concluziile studiilor, indeosebi a celor de tip cvasiexperimental Totusi, in lipsa accesului la rapoarte in format integral, in cazul Cochrane Collaboration este dificil sa se raspunda din perspectiva EBP la intrebarea legata de aplicabilitate (vezi tabelul 2 2) ideea unei liste de servicii avizate pe baza nivelului lor de validitate stiintifica a fost preluata de catre Comisia Metodologica a Colegiului Psihologilor din Romania cu referire la avizarea testelor (www copsi ro) Astfel, unele teste au primit aviz pe perioada nedeterminata (cele cu nivelul cel mai ridicat de dovezi privind existenta unor proprietati psihometrice solide), iar altele au primit un aviz pe perioada determinata (cele cu dovezi minimal acceptabile din perspectiva psihometrica) Desigur, exista si varianta unui aviz nefavorabil (pentru probele psihologice care nu indeplinesc nici macar criteriile minimale) Din pacate, lista oficiala prezinta doar probele din primele doua categorii, astfel ca nu este clar daca o proba a fost omisa din lista pentru ca a fost respinsa sau pentru ca nu a fost supusa procesului de evaluare Pentru o lista extinsa a bazelor de date internationale existente si a domeniului principal de aplicabilitate recomand consultarea Wikipedia (2012) in domeniul psihologiei organizationale exista mult mai putine resurse de acest gen (vezi, spre exemplu, ghidul dezvoltat pe tema selectiei de personal - SiOP, 2003) De altfel, SiOP (Society of industrial and Organizational Psychology) este principalul promotor al modelului EBP in domeniul psihologiei muncii si organizatienala in aceasta directie, incepand cu 2011 sub egida SiOP, impreuna cu SHRM (Society for Human Resources Management), au inceput sa fie publicate sinteze utile pentru practicieni pe baza informatiilor validate stiintific (vezi sintezele realizate de Ledford Jr si Heneman iii, 2011; Schneider si Barbera, 2011) Totusi, aceste sinteze au o structura apropiata mai degraba de evaluarile narative decat de cele sistematice Acest demers de colaborare poarta denumirea in limba engleza de SiOP SHRM Collaborative Series si are drept scop promovarea modelului bazat pe dovezi empirice valide stiintific in domeniul resurselor umane Se au in vedere aspecte care tin de validitatea interna Desigur, pot fi generate si alte tipuri de piramide care sa aiba in vedere alte tipuri de validitate, cum ar fi validitatea externa in astfel de situatii, sondajele de opinie sau panelurile efectuate pe un esantion reprezentativ de persoane ar ocupa locurile dinspre varful piramidei, chiar daca ar fi studii de tip non-experimental Din cauza eterogenitatii ridicate a calitatii designurilor studiilor cuprinse intr-o metaanaliza de studii experimentale, exista tendinta intalnita in domeniul medical de a plasa in topul increderii rezultatele obtinute in cadrul unui studiu randomizat controlat extins (large-scale randomized trials) (David, comunicare personala, 22 aprilie 2012) Acest tip de studiu experimental are trei caracteristici de baza: (a) implementarea se face prin cooperarea unor echipe de cercetare independente, in locatii independente; (b) se realizeaza pe un volum impresionant de participanti (de obicei N > 1 000) si (c) respecta un nivel ridicat de exigenta din perspectiva metodologica Avand in vedere aceste caracteristici tehnice si a resurselor uriase pe care le implica, acest gen de design este, dupa cunostintele mele, deocamdata absent din domeniul psihologiei in psihologie, prin tratament placebo se intelege o interventie aparent similara cu cea din grupul experimental, dar care nu urmareste sa modifice variabila dependenta de interes, efectul interventiei placebo fiind localizat asupra unui aspect nerelationat cu variabila dependenta in cazul efectului placebo, ideal ar fi ca participantii la studiu sa nu poata distinge clar ce interventie au urmat iata un exemplu de interventie placebo (Birle, 2010) intr-un studiu de testare a eficientei unui program de training menit sa imbunatateasca capacitatea de decizie privind cariera scolara la elevii aflati in an terminal de liceu: atat participantii din grupul experimental, cat si cei din grupul placebo au urmat 10 sesiuni de training a cate 50 de minute fiecare Ceea ce a diferit a fost continutul predat, in cazul celor din grupul placebo, acesta nu avea legatura directa cu abilitatea de a lua decizii privind cariera, fiind predate informatii cu caracter general despre comunicare si rezolvarea de conflicte in opinia mea, sistemul GRADE este cel mai apropiat de realitatea practicienilor, atat prin simplitate, cat si prin faptul ca tine seama de aspecte importante pentru practica de zi cu zi, cum ar fi analiza similaritatii dintre situatia de rezolvat (caracteristicile clientului) si cele ale cercetarilor in care au fost obtinute rezultatele Seligman (1995) identifica cinci limite majore inerente studiilor experimentale descriptiv-cauzale (efficacy) prin raportare la practica cotidiana: (a) experimentele au o durata standard limitata spre deosebire de practica unde durata si intensitatea programului de interventie variaza; (b) practicienii pot interveni pe parcursul derularii interventiei corectand sau modificand unele aspecte gandite initial, in timp ce in experimentele de acest tip terapeutii urmeaza strict recomandarile din manualul de interventie; (c) in realitate clientii isi aleg de multe ori forma de psihoterapie urmata in baza preferintelor personale, iar aceasta motivatie, absenta in studiile bazate pe randomizarea participantilor, poate augmenta efectul obtinut; (d) in practica cei mai multi clienti au multiple comorbiditatii (mai multe tulburari), in timp ce in experimentele de tip efficacy sunt exclusi asemenea indivizi; (e) in practica este relevanta functionarea per ansamblu a individului, in timp ce in experimentele mentionate relevanta este eficienta interventiei asupra variabilei dependente tinta (primary outcome) in domeniul organizational au fost efectuate foarte putine studii experimentale (randomizate), deoarece majoritatea interventiilor au fost implementate si finantate direct de catre beneficiar (adesea organizatii orientate spre profit) Din acest motiv cele mai multe studii din zona testarii eficientei unei interventii sunt de tip cvasiexperimental Prin urmare, raportarea ar trebui sa tina seama de acest specific Capitolul 3 Strategii de cercetare in psihologie Scopul principal al acestui capitol este acela de oferi cititorilor o grila pragmatica de lectura a aspectelor ce tin de metodologia cercetarii, pe care le consider esentiale pentru dezvoltarea unei priviri de ansamblu despre activitatea de cercetare din domeniul psihologiei Prin urmare, in acest capitol nu ne vom opri asupra fundamentelor activitatii stiintifice, asupra notiunilor de epistemologie sau asupra traditiilor si curentelor de abordare din filosofia stiintei si din logica Cei interesati de aceste aspecte conceptuale bazale pot gasi informatii relevante in primele doua capitole din David (2006) in schimb, scopul acestui capitol este acela de a contribui la dezvoltarea gandirii critice si a spiritului analitic, atunci cand se planifica un studiu psihologic, respectiv atunci cand se analizeaza critic rezultatele provenite din cercetari realizate de altii Pentru a atinge acest deziderat, am impartit capitolul de fata in sase sectiuni aparent eterogene, din combinarea carora speram sa oferim cititorilor interesati acea grila de lectura critica utila si o viziune de ansamblu asupra demersului de cercetare Accentul este pus pe metodologia de cercetare de tip cantitativ, aceasta fiind perspectiva dominanta la ora actuala in psihologie 3 1 False dileme in cercetarea psihologica Activitatea de cercetare presupune o serie de decizii din partea celui care o efectueaza, fiecare dintre acestea avand un impact important asupra rezultatului final obtinut intre aceste decizii de luat se regasesc si o serie de false dileme sau afirmatii Pe cele mai raspandite dintre acestea, intalnite in cei peste 10 ani de activitate in zona psihologiei academice, le vom prezenta in continuare 3 1 1 Metode de cercetare cantitative vs metode de cercetare calitative in psihologie Pe de o parte, am intalnit colegi care sustin cu tarie ca cea mai potrivita modalitate de a accesa nivelul de profunzime al psihicului este prin metode calitative de cercetare, deoarece metodele cantitative trateaza la un nivel superficial fenomenele psihice Am sesizat ca aceasta pozitie nefavorabila metodologiei cantitative este imbratisata indeosebi de cei care manifesta o nesiguranta in stapanirea aparatului metodologic si sau statistic, ceea ce ma face sa cred ca rolul acestor credinte este unul defensiv, actionand ca un veritabil mecanism de aparare Pe de alta parte, am intalnit colegi de breasla care incercau sa dezlipeasca de sens orice demers de cercetare psihologica, inlocuindu-l cu un sir lung de cifre (rezultate statistice), desprinse de semnificatia lor teoretica psihologica Pentru acestia, cercetarea de tip calitativ are doar un rol secundar, acela de a oferi date congruente pentru a confirma sau ilustra rezultatele cantitative obtinute Din punctul meu de vedere, o asemenea dilema, cantitativ vs calitativ, este una falsa, deoarece problema superioritatii unei forme sau alta de cercetare nu se poate pune in termeni abstracti, ci numai in legatura cu un anumit obiectiv de studiat Asadar, problema pusa in termeni corecti ar fi aceea de a stabili care dintre cele doua forme de metodologie este mai potrivita pentru un anumit obiectiv de cercetare vizat De pilda, cercetarea calitativa pare a fi mai potrivita atunci cand obiectivul studiului vizeaza intelegerea unor fenomene din perspectiva actorului, descriind realitatea asa cum este ea perceputa de catre participanti, pornind de la premisa ca este mai important ceea ce percep oamenii ca fiind realitate, decat realitatea observabila insasi (Kvale apud Gilbert si irons, 2008) in schimb, metodologia de tip cantitativ este mai potrivita atunci cand obiectivul studiului este de a stabili existenta unei relatii de tip cauza-efect, cum ar fi identificarea masurii in care o anumita forma de psihoterapie este eficienta in combaterea atacurilor de panica 3 1 2 O cercetare este cu atat mai valoroasa cu cat analizele statistice sunt mai complexe Aparent, apelul la metode statistice sofisticate, cum ar fi modelarea prin ecuatii structurale, apelul la regresii logistice sau analiza de clustere, ofera o prestanta superioara oricarui demers stiintific intr-o anumita masura, o asemenea concluzie este sprijinita de multitudinea si complexitatea relatiilor dintre diverse fenomene Realitatea poate fi surprinsa mai bine prin tehnici statistice multivariate decat prin cele apartinand statisticii uni- sau bivariate in esenta, insa, calitatea ridicata a unei cercetari este determinata indeosebi de problema investigata si de noutatea (importanta) teoretica sau aplicativa a subiectului studiat A apela la ecuatii structurale pentru a demonstra lucruri arhicunoscute (de exemplu, ca inteligenta si motivatia scolara, chiar surprinse ca variabile latente, prezic performanta scolara a elevilor) reprezinta un demers stiintific desuet, chiar daca corect din punct de vedere statistic De asemenea, apelul la tehnici statistice complexe pentru a compara empiric modele care nu au nicio relevanta aplicativa sau nicio fundamentare teoretica reprezinta o alta tendinta care trebuie descurajata in consecinta, o prelucrare statistica de exceptie, desi necesara, nu tine locul unei cercetari de o calitate superioara Ceea ce conteaza, in primul rand, este importanta problemei investigate si adecvarea metodologiei de cercetare (design, metode de cercetare si de analiza a datelor) la obiectivul propus al studiului 3 1 3 O cercetare este mai valoroasa daca isi propune sa investigheze mai multe aspecte Gandirea de tipul "mai mult este mai bine" am regasit-o destul de frecvent, mai ales in randul studentilor, atunci cand acestia isi puneau problema in studiile lor, daca trei ipoteze sau patru probe psihologice utilizate sunt suficiente, daca doua obiective ajung etc Desigur, asemenea dileme constituie un indiciu potrivit pentru a detecta lipsa abilitatii de a face cercetare, prin neintelegerea aspectului central situat la baza activitatii de cercetare Astfel, orice demers de cercetare trebuie sa se raporteze in permanenta la intrebarea supusa investigarii (obiectivul cercetarii) Numai prin raportare la acest aspect esential se pot formula adecvat ipoteze de cercetare si se pot stabili corect aspecte specifice, precum tipul de design al cercetarii, numarul de instrumente necesare (variabile de operationalizat) etc in consecinta, numarul de obiective, de ipoteze, de instrumente utilizate nu este relevant in sine, ci se stabileste in functie de aspectele investigate in cercetarea respectiva Pot exista cercetari cu un singur obiectiv si o singura ipoteza principala de investigat, mult mai valoroase din punct de vedere teoretic sau aplicativ decat cercetari care investigheaza simultan mai multe aspecte redundante arhicunoscute (cum ar fi asocierea dintre nivelul de anxietate si cel de neuroticism) sau irelevante pentru obiectivul studiului (cum ar fi diferenta dintre baieti si fete cu privire la numarul de ore de vizionare zilnica la TV intr-un studiu care urmareste sa stabileasca daca exista o asociere intre stilul parental autoritar si comportamentul prosocial al copiilor) 3 1 4 La nivelul studiilor doctorale in psihologie, cercetarea derulata trebuie sa propuna ceva original, care sa revolutioneze domeniul de interes al tezei ideea ca stiinta progreseaza prin experimente unice, cruciale este o perceptie predominant gresita, determinata mai degraba de titlurile din mass-media si de absenta unei culturi stiintifice, inclusiv in randul multor absolventi de studii superioare Fara a nega posibilitatea unor asemenea exceptii, cel mai frecvent cunoasterea progreseaza gradual prin contributii limitate la problematica investigata Deoarece unul dintre cele mai importante mesaje ale acestei lucrari este ca nicio cercetare nu este perfecta din perspectiva validitatii concluziilor rezultate (vezi detalii in sectiunea 3 4 a acestui capitol), este important ca orice demers investigativ sa fie conectat la cele anterioare si sa incerce sa rezolve o necunoscuta pe care studiile anterioare fie nu au abordat-o, fie nu au reusit sa o rezolve in mod concludent Cu alte cuvinte, un demers respectabil pentru orice teza de doctorat, respectiv pentru orice lucrare de cercetare in genere, este acela de a conduce unul sau mai multe studii care sa elimine unele dintre neajunsurile sesizate in cercetarile anterioare efectuate pe tematica respectiva Desigur, acest demers trebuie insotit de sublinierea impactului teoretic si sau aplicativ al studiilor propuse Pentru a ilustra acest principiu al progresului gradual in cunoastere, cititi continutul casetei 4 2 din capitolul urmator (capitolul 4), in care sunt prezentate o serie de studii succesive cu privire la relatia cauzala dintre dispozitia afectiva pozitiva si nivelul de altruism 3 2 Probleme stringente in cercetarea psihologica din Romania Daca aspectele amintite anterior reprezinta false probleme cu care se confrunta multi consumatori sau producatori de cercetare din Romania, voi aminti in cele ce urmeaza patru probleme importante care pot impieta dezvoltarea sanatoasa a cercetarii in psihologie din tara 3 2 1 Cultura stiintifica deficitara Exista cercetari bune si cercetari cu rezultate distorsionate Din nefericire insa, am constatat ca o buna parte dintre studentii sau absolventii de psihologie nu pot distinge corect intre diferitele tipuri de designuri de cercetare (experimental, cvasiexperimental sau non-experimental), fiindu-le cu atat mai greu sa faca diferente intre cercetari apartinand aceleiasi clase de design din perspectiva riscurilor existente in cazul validitatii concluziilor studiului in lipsa acestei competente tehnice, ei tind sa acorde credit informatiilor prezentate in studiile respective, indiferent de gradul acestora de acoperire in spatele acestui credit sta premisa uneori eronata ca studiile prezinta adevaruri valide, de vreme ce ele au fost publicate si sunt efectuate de catre personalitati din domeniul academic sau de formatori de scoli psihoterapeutice etc insa nu toate studiile ajung sa fie publicate in reviste prestigioase, fundamentate pe un proces de evaluare colegiala foarte exigent O parte semnificativa din studii ajung sa fie publicate in reviste cu o politica editoriala mai putin riguroasa, aspect decelat cu dificultate de catre nespecialisti Acest segment de consumatori de literatura academica, posesor al unei culturi metodologice deficitare, este cel mai predispus sa cada in capcanele abordarilor pseudostiintifice reliefate pe larg in primul capitol al cartii, cum ar fi indeosebi extinderea fara temei a concluziilor, distorsiunea de confirmare, inversarea demersului de validare stiintifica s a m d 3 2 2 Probleme etice in derularea studiilor si analiza rezultatelor Spre deosebire de situatia existenta in statele occidentale, aspectele etice relationale activitatii de cercetare psihologica din Romania raman in multe cazuri abordate doar la un nivel teoretic La aceasta stare de fapt contribuie deopotriva absenta unei instante din multe universitati care sa evalueze specific studiile de cercetare propuse inca din stadiul de proiect, cat si lipsa unei cutume din partea cercetatorilor de a utiliza formulare de consimtire informata atunci cand isi deruleaza cercetarile pe diferite categorii de participanti O problema la fel de grava, intalnita atat in randul practicienilor psihologi, dar si in unele medii studentesti, este aceea a utilizarii de instrumente psihologice fara a avea drept de utilizare (cu incalcarea drepturilor de autor asupra acestora) Nu in ultimul rand, o alta problema de natura etica, adesea tratata cu tacere, este aceea a falsificarii fabricarii rezultatelor sau a utilizarii selective a datelor provenite din analizele statistice efectuate (ignorate fiind cele care nu sprijina ipotezele formulate si sau rezultatele nesemnificative statistic) O discutie elaborata asupra acestei teme este prezentata in capitolul 8, sectiunea 8 2 2 Pentru moment ne vom rezuma doar sa amintim cele trei mari fraude existente: (a) fabricarea datelor; (b) falsificarea datelor; si (c) plagiatul pentru care exista sanctiuni drastice care pot merge pana la retragerea titlurilor stiintifice sau profesionale dobandite Restul aspectelor constituie abateri de la buna conduita care trebuie corectate de autor atunci cand sunt semnalate 3 2 3 Probleme metodologice i: inadaptarea literaturii de specialitate la obiectivele studiului O afirmatie dura, dar din nefericire nu foarte indepartata de adevar, este aceea ca, in foarte multe cazuri, ceea ce apare in sectiunile introductive ale unor articole publicate in reviste romanesti de specialitate poate fi inclus in categoria "maculatura" Adesea, sectiunile introductive se apropie de ideea unor referate despre conceptele uzitate in lucrare De exemplu, intr-un studiu care vizeaza rolul predictiv al inteligentei generale asupra performantei in munca a unui lot de cadre didactice mi-a fost dat sa vad ca nu se discuta direct problema abordata ("ce anume nu e clar asupra acestei relatii din literatura anterioara?", "de ce ar fi important sa studiem aceasta problema?", respectiv "ce si cum anume va reusi studiul nostru sa rezolve o parte din necunoscutele semnalate?") in schimb este posibil sa intalnim un intreg pomelnic despre istoricul evolutiei conceptului de inteligenta (de la Galton si Binet pana in prezent), sa gasim o prezentare detaliata a conceptului de masurare a performantei in munca si a tipologiilor asociate existente, plus, eventual, un scurt sumar necritic al studiilor care au abordat relatia dintre inteligenta si performanta profesionala Cititorii interesati sa-si imbunatateasca abilitatea de a redacta sectiunile introductive ale articolelor lor de specialitate au la dispozitie un ghid prescriptiv pe aceasta problematica in sectiunea 8 1 4 (capitolul 8) 3 2 4 Probleme metodologice ii: inadaptarea metodologiei cercetarii la obiectivele studiului O alta problema intalnita destul de frecvent consta in utilizarea unui design de cercetare inadecvat pentru a raspunde specificului intrebarilor din studiu Astfel, am intalnit studii ce contineau afirmatii care sprijina existenta unor relatii de tip cauza-efect, desi designul utilizat nu le permitea acest lucru, fiind vorba de studii corelationale in mod similar, am sesizat situatii in care se ofereau explicatii (era postulat un anumit mecanism cauzal) in studii al caror design experimental nu permitea identificarea unor mecanisme ale schimbarii etc Concluziile rezultate din asemenea studii contin afirmatii hazardate, ce nu se sustin din cauza lipsei controlului adecvat asupra factorilor de risc ce pun in pericol validitatea studiilor respective in restul capitolului de fata, accentul este pus pe reducerea acestui tip specific de erori, astfel incat sa fie clar ce tip de studii si ce fel de design metodologic aferent este mai potrivit pentru a raspunde la o anumita problema de cercetat in acest sens vom trece, mai intai, in revista tipurile majore de cercetare si impactul lor asupra intrebarilor de cercetare care pot fi adresate 3 3 Tipuri de cercetari si relevanta lor pentru procesul cunoasterii Prin cercetare in sens larg se intelege o activitate care produce cunoastere Cercetarea stiintifica este un anumit tip de cercetare, deosebita de cea filosofica sau de cea teologica prin metodologia utilizata pentru a ajunge la "adevar", la acele cunostinte necesare rezolvarii unor probleme (David, 2006) Din acest punct de vedere, al impactului pe care il are in cunoastere si al sferei de problematici ce pot fi rezolvate, cercetarea stiintifica poate fi clasificata ca: (a) cercetare fundamentala; (b) cercetare aplicata; (c) cercetare pentru dezvoltare si inovare in cadrul psihologiei si a stiintelor sociale in general, cercetarea aspectelor psihice poate accentua fie realitatea observabila, data (independenta de credintele celui evaluat), fie realitatea construita de subiectul cercetarii (semnificatia si interpretarea realitatii construite de catre subiect) in primul caz vorbim de (a) o paradigma realista, pozitivista de abordare a psihologiei, iar in cel de-al doilea despre (b) o paradigma constructivista (hermeneutica sau fenomenologica) Luand in calcul caracteristicile metodologiei de cercetare utilizate, cercetarea stiintifica poate apela la: (a) metodologii calitative sau la (b) metodologii cantitative Tot din punct de vedere metodologic, luand in calcul gradul de control al variabilelor confundate vorbim despre: (a) studii experimentale; (b) studii cvasiexperimentale si (c) studii non-experimentale in sfarsit, dupa obiectivul pe care il poate avea un studiu si pornind de la rolul cunoasterii stiintifice de a descrie, prezice si explica fenomene psihice, putem imparti cercetarile stiintifice in: (a) cercetari exploratorii; (b) cercetari descriptiv-analitice; (c) cercetari cauzale Aceasta ultima categorie poate fi la randul ei divizata in cercetari cauzal-descriptive si cercetari cauzal-explicative in cele ce urmeaza vom oferi o serie de informatii suplimentare despre fiecare tip de clasificare, accentuand acele aspecte care evidentiaza tipul de intrebari de cercetare la care se poate raspunde printr-un anumit tip de cercetare in acest demers, ne vom focaliza indeosebi pe ultima dintre clasificari, deoarece aceasta adreseaza direct problematica selectarii celui mai potrivit tip de design de cercetare in functie de intrebarea cercetarii (obiectivul studiului) 3 3 1 Cercetare fundamentala vs cercetare aplicata vs cercetare pentru dezvoltare-inovare La originea distinctiei dintre cele trei forme de cercetare se afla conflictul dintre modelul cartezian de a vedea stiinta (rolul fundamental al stiintei este de a cunoaste si intelege lumea) si modelul lui Francis Bacon (rolul stiintei este de a ameliora bunastarea oamenilor, utilitatea descoperirilor plasandu-se inaintea cunoasterii in sine) (Bevan, 1980 apud Kantowitz, Roediger iii si Elmes, 2009) Daca ar fi sa ne raportam la cazul specific al psihologiei, cercetarea fundamentala se incadreaza in primul model de cunoastere, fiind interesata indeosebi sa gaseasca explicatii pentru modul de functionare a psihicului uman (de exemplu, "cum poti reduce un comportament indezirabil, in general?"), in timp ce cercetarea aplicata si cea orientata spre dezvoltare-inovare se centreaza asupra masurii in care anumite cunostinte rezultate din cercetarea fundamentala pot fi aplicate in contexte specifice pentru a rezolva probleme concrete sau pentru a veni in sprijinul unor nevoi pe care le au oamenii (de exemplu, "cum poti sa modifici comportamentul copiilor care sufera de enurezis, in directia reducerii acestor comportamente?") Din punct de vedere pedagogic, cele doua tipuri majore de cercetare, fundamentala vs aplicata, se diferentiaza prin: (a) gradul de generalizare a rezultatelor obtinute (transferabilitate ridicata in cercetarea fundamentala vs transferabilitate limitata in cercetarea aplicativa) ; (b) prin gradul de utilitate a rezultatelor obtinute (utilitate practica imediata absenta redusa - cercetarea fundamentala; utilitate practica imediata ridicata - cercetarea aplicativa); (c) accentul pe aspecte teoretice in dauna practicii (accent pe aspecte teoretice, pe cunostinte declarative in cercetarea fundamentala; accent pe implicatii practice, pe cunostinte procedurale in cercetarea aplicativa) in realitate, distinctia dintre ele este mai degraba una teoretica, deoarece cel mai adesea relatia dintre ele este sub forma unui continuum care are la un capat cercetarea fundamentala, iar la celalalt capat cercetarea aplicativa Pentru a ilustra aceasta idee, voi apela la un exemplu din psihologia sociala Daca obiectivul studiului este acela de a evidentia caracteristicile procesarilor cognitive stereotipice cu referire la outgrup ne aflam mai degraba pe teritoriul cercetarii fundamentale Daca ne propunem sa oferim solutii care sa reduca conflictele intereinice prin reducerea stereotipurilor negative cu referire la membrii unui outgrup ne deplasam pe acel continuum dinspre cercetarea fundamentala spre cea aplicata in sfarsit, daca ne propunem sa studiem efectul unei interventii de reducere a stereotipurilor negative fata de rromi (bazandu-ne pe informatiile oferite de cercetarile anterioare mentionate) ne aflam in zona cercetarii aplicate Din cadrul cercetarii aplicate se desprinde un tip aparte de studii, constituite sub denumirea generica de cercetare pentru dezvoltare si inovare Aceasta apare atunci cand cercetarea aplicata atinge acel nivel care-i permite sa raspunda direct nevoilor unor clienti prin oferirea de servicii, produse sau tehnologii inovative solicitate de catre acestia Cel mai adesea, produsul final in asemenea cazuri nu se materializeaza prin publicatii stiintifice, ca in cazul cercetarii fundamentale sau aplicate, ci prin brevete si sau prototipuri tehnologice in sfarsit, o idee importanta este aceea ca cele trei forme de cercetare nu difera din perspectiva metodologiei cercetarii uzitate in toate cele trei cazuri putem gasi deopotriva studii experimentale sau corelationale, studii cantitative sau calitative Totusi, in cercetarea fundamentala se observa un accent ridicat pus pe studiile de tip experimental, indeosebi spre acele studii cauzal-explicative (vezi sectiunea 3 3 5) ce permit oferirea de explicatii pentru relatiile de tip cauza-efect constatate 3 3 2 Cercetari in paradigma pozitivista vs paradigma interpretativa Pe langa importanta si utilitatea practica a problemei cercetate, o amprenta importanta asupra cercetarii derulate o are perspectiva filosofica din care este abordata tema respectiva stiinte naturale vs stiinte umaniste; etic vs emic; pozitivism vs hermeneutica (interpretivism); nometetic vs ideografic; cantitativ vs calitativ; naturalism vs relativism; dat vs constructie; psihologia hard si psihologia soft etc reprezinta diferite terminologii utilizate pentru a sublinia o distinctie importanta existenta in cercetarea psihologica Pe de o parte se afla cercetatorii sustinatori ai paradigmei pozitiviste Conform acestora, cunoasterea stiintifica rezulta din aplicarea metodologiei stiintifice pentru a testa teoriile (adesea subiective) formulate Astfel, se accentueaza ideea studiului riguros al comportamentului uman, pornind de la premisa ca fenomenele psihice, la fel ca si relatiile sociale functioneaza in baza unor legitati care trebuie descoperite, asemenea legilor (de exemplu, gravitatia) din stiintele naturale Prin urmare, accentul in aceasta perspectiva cade asupra determinarii suportului empiric existent pentru afirmatiile facute (de exemplu, surprinderii unei relatii cauzale) si pe controlul eliminarea aspectelor introspective, subiective, considerate a pune in pericol validitatea studiilor in aceasta paradigma, aspectele subiective nu sunt de interes decat din perspectiva masurilor de control, in vederea eliminarii riscului ca asemenea aspecte subiective sa afecteze (distorsioneze) cunoasterea fenomenelor studiate Pe de alta parte se afla cercetatorii sustinatori ai ideii ca important pentru domeniul stiintelor sociale (psihologia fiind inclusa formal printre acestea) este sa se studieze mai degraba valorile, simbolurile, credintele personale si normele sociale, toate acestea accentuand constructiile psihologice, perspectiva social istorica, subiectiva asupra lucrurilor, tinandu-se cont de contextul cercetarii si de dinamica interactiunii dintre cercetator si participanti in acest caz, accentul nu cade pe surprinderea unor relatii deterministe, cauzale, specifice, ci pe surprinderea intentiilor, a intregului, a modului in care participantii interpreteaza si inteleg ceea ce traiesc din punct de vedere psihologic, dar si a influentei pe care mediile social, istoric si politic le au asupra acestor constructii De asemenea, in abordarea interpretativa, aprecierea calitatii unei cercetari se face apeland la criterii diferite fata de abordarea pozitivista in aceasta abordare, demersul stiintific urmareste surprinderea nivelului de impartasire al unor opinii trairi intre participanti cu privire la problematica investigata, cu interpretarea semnificatiei acestora in gradiente diferite, in functie de paradigma dominanta de abordare (constructivista, fenomenologica, hermeneutica, feminista, einografica etc sau a unei combinatii dintre acestea) De exemplu, in paradigma fenomenologiei hermeneutice, accentul este pus pe gasirea unor semnificatii (interpretarea) evenimentelor traite, luand in calcul inclusiv detalii care pot oferi insighturi despre fenomenul analizat Pentru a face acest lucru cercetatorul apeleaza la bagajul sau de cunostinte, de pre-intelegere a lumii, luand in calcul contextul social si istoric in care traiesc participantii la studiu (Laverty, 2003) Spre deosebire de aceasta paradigma, imbratisata indeosebi de stiintele umaniste, paradigma pozitivista apeleaza la alte reguli de apreciere a calitatii unor studii Daca in abordarea de tip interpretativ cercetatorul introduce ca input cunostintele sale si se bazeaza pe subiectivism pentru a desprinde semnificatii, in paradigma pozitivista cercetatorul incearca sa elimine orice input subiectiv din interpretarea datelor, bazandu-se doar pe cel oferit din datele colectate prin apelul la o metodologie riguroasa De aceea, in analiza calitatii cercetarilor efectuate, paradigma pozitivista tine cont de nivelul de intemeiere a concluziilor, din perspectiva valorii lor de adevar ("cat de siguri suntem ca afirmatia respectiva este adevarata sau falsa?"), acest lucru fiind determinat in functie de adecvarea metodologiei utilizate la intrebarea cercetarii Aceasta distinctie esentiala pentru aprecierea calitatii unei cercetari (prin prisma "valorii ei de adevar obiectiv", respectiv din prisma "progresului in intelegerea fenomenului si a nivelului de impartasire a esentialului din fenomenul trait") este deseori ignorata, fapt ce poate duce la confuzii importante si rezultate distorsionate Un exemplu graitor in acest sens este studiul tulburarilor emotionale ale adolescentilor ramasi acasa si ai caror parinti muncesc in strainatate Apeland la o metodologie calitativa de investigare, specifica unui demers interpretativ, vom putea ajunge la o concluzie impartasita de participanti, aceea a experimentarii unor dificultati de ordin emotional, resimtite subiectiv ca urmare a dorului de parinti si a insuficientei suportului emotional perceput Dar este aceasta metodologie capabila sa raspunda la o intrebare a cercetarii de tip cauzal (plecarea parintilor determina probleme emotionale la copii)? Raspunsul este unul negativ intrebari care vizeaza relatii de tip cauza-efect necesita apelul la abordari metodologice riguroase, focalizate pe controlul experimental astfel incat sa permita stabilirea unei valori de adevar (adevarat sau fals) cu privire la intrebarea din studiu (pentru mai multe detalii privind rigurozitatea controlului experimental, vezi sectiunea 4 1 din capitolul urmator, indeosebi prima parte) Pentru moment ne vom rezuma doar sa amintim ca pot exista o serie de variabile potential confundate pentru aparitia unor tulburari emotionale la adolescentii ai caror parinti sunt plecati in strainatate (Sava, 2011), cum ar fi: (a) stilul parental autoritar mai des intalnit in familii cu nivel scazut de educatie (status intalnit frecvent printre familiile in care parintii sunt plecati la munca in strainatate) sau (b) relatii de cuplu conflictuale existente inca dinaintea plecarii in strainatate (mai des intalnite in cazul acestui tip de familii decat in familiile cu ambii parinti acasa) Astfel, este posibil ca eventualele tulburari emotionale observate la adolescentii ai caror parinti sunt plecati la munca in strainatate sa nu fie cauzate de absenta parintilor, ci sa fie existente inca dinaintea plecarii lor, determinate de o vulnerabilitate emotionala crescuta, specifica unor contexte familiale in care adolescentul este martor al unor conflicte repetate intre parinti, precum si "beneficiar" al unui stil de educatie autoritar, bazat predominant pe masuri de constrangere in schimb, aceeasi metodologie calitativa ar fi adecvata pentru a raspunde la o intrebare de cercetare care ar urmari sa descrie "ce cred adolescentii despre impactul emotional determinat de plecarea parintilor la munca in strainatate" in acest caz, miezul intrebarii consta in decelarea semnificatiilor si interpretarilor pe care adolescentii le ofera trairilor afective experimentate in noul context familial - in absenta parintilor de acasa, indiferent daca credintele lor sunt conforme cu realitatea sau unele distorsionate Tabelul 3 1 Sumar al particularitatilor cercetarilor in functie de paradigma filosofica utilizata Aspect evaluat Paradigma pozitivista Paradigma constructiv-hermeneutica Asumptii Fenomenele psihosociale au legitati ce pot Nu exista un adevar absolut, ci diferite ontologice fi descoperite, asemeni legitatilor din realitati subiective si adevaruri fizica Asumptii Cunoasterea este obiectiva si poate fi Cunoasterea este subiectiva, dependenta epistemologice atinsa prin metode stiintifice riguroase cultural si filtrata de perceptiile si trairile individului evaluat Rolul cercetatorului Ramane detasat in abordarea problemei Se implica subiectiv in tema, uneori pana la studiate, luand masuri active pentru a-si nivelul de a experimenta la randul sau mentine obiectivitatea trairile asociate problemei studiate Focusulin Focalizare pe descrierea si explicarea Focalizare pe intelegerea si interpretarea cercetare comportamentului trairilor asociate comportamentului Metodologie utilizata Predominant cantitativa, cu sublinierea Predominant calitativa, fara a diferentia clar diferentelor dintre fapte si opinii intre fapte si opinii Evaluarea validitatii concluziilor unei cercetari Ceea ce conteaza este valoarea de adevar a Ceea ce conteaza este masura in care concluziilor obtinute insighturile si interpretarile noi oferite ajuta la o mai buna intelegere a fenomenului si sunt impartasite de catre participanti Contributia la cunoastere Sunt apreciate indeosebi cercetarile care Nu se urmareste oferirea unui raspuns clar evidentiaza legitati, adevaruri universale, la intrebarea cercetarii, ci se prefera ca in acest sens avantajate fiind cercetarile interpretarea fenomenului sa conduca la noi fundamentale (de tip cauzal-explicativ) insighturi in legatura cu tema studiata ilustrari ale unor teme de studiu posibile Satisfactia profesorilor Relatia dintre cresterea numarului de elevi O investigatie narativa a perceptiilor si dintr-o clasa si satisfactia cadrelor emotiilor profesorilor ca urmare a didactice modificarii dimensiunii unei clase Un studiu metaanalitic cu privire la Ce semnifica pentru barbati sedintele de eficienta psihoterapiei in tratarea psihoterapie pentru disfunctiile erectile? O Tulburari de disfunctiilor erectile abordare fenomenologica erectie investigarea secventelor emotionale prin Afectivitatea negativa ca predictor al care trec angajatii care parasesc locul de fluctuatiei de personal munca Fluctuatia de personal 3 3 3 Cercetari cantitative vs cercetari calitative Este posibil ca un numar important de cititori sa ramana cu impresia ca aspectele mentionate in paragrafele anterioare se potrivesc pentru a distinge si intre studiile cantitative si cele calitative, pornind de la faptul ca abordarea cantitativa este optiunea standard pentru perspectiva pozitivista, in timp ce metodologia calitativa este optiunea de start in studiile bazate pe paradigma interpretativa Cu toate acestea, lucrurile nu stau intotdeauna asa Diferentierea dintre studii de tip cantitativ si cele de tip calitativ are in vedere metodologia utilizata in colectarea datelor, in timp ce tipul de paradigma abordata influenteaza modul in care sunt analizate si interpretate rezultatele Astfel, este posibil ca un studiu care aplica o metodologie de cercetare de tip calitativ (interviuri aprofundate realizate pe cativa participanti-cheie) sa apeleze la analiza de continut (metoda cantitativa) si sa interpreteze exclusiv rezultatele obtinute in urma acestei analize (o maniera de lucru specifica pentru abordarea pozitivista) Astfel, nu se poate pune un semn de egalitate intre cercetarea calitativa si abordarile de tip interpretativ, pentru ca datele calitative colectate pot fi integrate intr-o maniera pozitivista Reversul este de asemenea teoretic posibil, desi este mai putin intalnit in practica De exemplu, intr-o cercetare cu un obiectiv explorator poate fi aplicata o metodologie de tip cantitativ (aplicare de chestionare in cadrul unui sondaj efectuat pe un esantion reprezentativ), insa interpretarea sa fie una de tip hermeneutic Se poate ajunge aici daca: (a) accentul in studiu este pus mai degraba pe interpretarea si intelegerea fenomenului studiat decat pe descrierea lui; (b) cercetatorul abordeaza intr-o maniera subiectiva tema, interpretand rezultatele prin prisma opiniilor si cunostintele sale anterioare despre subiect (mergand dincolo de ceea ce ii permit datele colectate); (c) isi construieste discursul (concluziile) intr-o maniera mai degraba hermeneutica, context in care se foloseste de datele cantitative colectate ca temeiuri pentru comentariile sale de ordin calitativ Apoi, alegerea unei metodologii de lucru de tip cantitativ sau calitativ este dependenta si de gradul de cunoastere al subiectului abordat Daca tema investigata se refera la un subiect despre care se cunosc putine lucruri, este preferabil un demers de tip explorator, situatie in care metodologia de tip calitativ are un avantaj prin flexibilitatea ridicata cu privire la tipul de date colectate in schimb, daca subiectul abordat este unul cunoscut, demersul de cercetare depaseste stadiul unui studiu explorator, caz in care preferabila este metodologia de tip cantitativ Prin urmare, in decizia de alegere a unei metodologii cantitative sau calitative intra doi factori importanti: (a) gradul de cunoastere a temei cercetate, decurgand din aceasta obiectivul de cercetat; (b) asumptiile filosofice ale cercetatorului (aplecare spre a descrie si explica realitatea observabila sau spre a interpreta si acorda semnificatii aspectelor [realitatii] construite) O serie de cercetatori precum Kazdin (2010), Elliot si Timulak (2005) sau Bedos, Pluye, Loignon si Levine (2009) au subliniat principalele diferente dintre metodologia cantitativa si cea calitativa, cele mai importante fiind reflectate in tabelul 3 2 Aceste informatii sunt utile pentru a oferi celor interesati o privire de ansamblu pentru a aprecia care metodologie ar trebui utilizata in functie de problema investigata (obiectivul studiului) Tabelul 3 2 Sumar al particularitatilor metodologiei cantitative vs calitative Aspect Metodologia cantitativa evaluat Obiectivul De obicei este unul inferential, studiului bazat pe formularea si testarea unor ipoteze de cercetare menite sa identifice asocieri intre variabile sau diferente intre grupuri Stadiul Aplicabila indeosebi asupra unor cunoasterii probleme cercetare anterior, despre problemei care exista deja o serie de studiate cunostinte Tema investigata este formulata adesea intr-o maniera inchisa, exacta (vezi modelul PiCO amintit in primele doua capitole) Stilul de importanta acordata controlului lucru in variabilelor cu potential confundat cercetare si riscurilor rezultate din tipul de design utilizat, pentru a reduce numarul de explicatii posibile Metodologia calitativa Este unul explorator, cu rolul de a descrie si interpreta (sau oferi insighturi pentru) problema studiata, fara a testa ipoteze de cercetare Aplicabila indeosebi in studiul unor probleme noi, despre care nu se cunoaste nimic sau se cunosc informatii insuficiente Tema investigata este formulata vag, adesea sub forma unei intrebari cu raspuns deschis (de exemplu, "in ce mod resimt adolescentii plecarea parintilor la munca in strainatate?") Variabilele relevante sunt studiate in contextul lor natural, fara a incerca sa izoleze influenta acestora de alti factori cu potential de variabile confundate Accentul se pune pe intreg, pe complexitatea descrierilor si interpretarilor, pe sensuri multiple care (explicatii alternative pentru rezultatul obtinut) pot rezulta din datele colectate Numarul de Numar mare pentru a asigura o participanti putere statistica adecvata in procesul de testare a ipotezelor Numar mic de participanti, compensat prin studierea lor in maniera intensiva (vezi tipul de date colectate) Tipul datelor Date numerice, preferabil prin colectate intermediul unor instrumente standardizate Flexibilitate Scazuta De obicei intreaga metodologica procedura este una standardizata, algoritmica, mergand in cazul experimentelor pana la masuri cum ar fi contrabalansarea, pentru a contracara distorsionari potentiale in rezultate Analiza Prin intermediul tehnicilor datelor statistice, tinand seama in colectate interpretare de limitarile impuse de designul de cercetare utilizat Descrieri narative, istorisiri, care nu sunt ulterior prelucrate in termeni cantitativi (analiza de continut fiind o metoda cantitativa) Medie Exista o planificare initiala, care poate fi ajustata pe parcursul colectarii datelor, in functie de nevoi (de exemplu, in cazul utilizarii interviurilor sunt preferate cele nestructurate sau semistructurate) Analiza de text cu scopul: (a) de a descrie (de exemplu, a stabili teme centrale asociate problemei studiate din perspectiva trairilor participantilor); (b) de a interpreta oferi sensuri si semnificatii acestor trairi, prin apelul la filtrul subiectiv sau amprenta cercetatorului si la teoriile naive ale participantilor chestionati Aprecierea Sunt preferabile studiile ale caror calitatii rezultate sunt replicate si care demersului conduc la teorii care sa ne ajute sa de cercetare descriem si explicam mai bine aspectele psihologice investigate Sunt preferate studiile ce contin descrieri care capteaza esenta fenomenului studiat Rezultatul este impartasit de ceilalti si poate fi replicat si sau obtinut din surse multiple (triangulare), accentul fiind pus pe intelegerea aprofundata a fenomenului Desigur, asa cum in cazul metodologiei cantitative exista diferente mari de la un anumit tip de studiu la altul (de exemplu, intre un sondaj de opinie si un studiu experimental), in mod similar, sub umbrela metodologiei calitative se regasesc o multitudine de abordari posibile Creswell (2007) aprofundeaza cinci asemenea directii: (a) studiile narative (accentul cade pe intervievarea subiectilor pentru a relata istorioare din viata lor [istorii orale], urmate de realizarea unei sinteze literare in care sa fie relatata viata indivizilor); (b) studiile fenomenologice (accentul este pus pe surprinderea esentei experientei studiate); (c) studiile einografice (accentul se face pe interpretarea experientelor respective prin prisma culturii impartasite de grupul din care indivizii fac parte); (d) studiile fundamentate (grounded theory) (in care se accentueaza ideea generarii unei teorii perspective despre experienta analizata pe baza opiniilor colectate de la participantii la studiu) si (e) studiile de caz de tip calitativ (in care predomina interesul de a obtine o analiza profunda a experientei individului, preferabil prin prisma unei teorii, facand apel la surse multiple de documentare) in sfarsit, merita subliniata expansiunea unei abordari stiintifice noi, cunoscuta sub denumirea de metodologie mixta (Tashakkori si Teddlie, 1998), designul metodelor de cercetare mixte (Creswell, 2006) sau, mai frecvent, metode de cercetare mixte (mixed method research) (Creswell, 2006) Aceasta incearca sa combine demersul cantitativ, cu cel calitativ, pentru a beneficia de avantajele strategice ale ambelor metodologii (o intelegere aprofundata a constructului studiat - abordarea calitativa; controlul variabilelor straine si o crestere a nivelului de generalizare a rezultatelor - abordarea cantitativa) (Creswell, 2006; Steckler et al , 1992) Figura 3 1 prezinta patru situatii in care este recomandabila utilizarea unui design mixt, primele doua in care metodologia calitativa este utilizata ca un adjuvant la cea cantitativa, cea de-a treia referindu-se la reversul situatiei, iar ultima, ca un posibil exemplu de triangulare, astfel incat rezultatul obtinut sa fie sprijinit prin utilizarea ambelor tipuri de metodologie Figura 3 1 ilustrarea celor mai intalnite tipuri de design mixt Adaptare dupa Steckler et al (1992) 3 3 4 Cercetari experimentale vs cercetari cvasiexperimentale vs cercetari non-experimentale Ultimele doua clasificari ale tipurilor de cercetari mentionate la 3 3 2 si 3 3 3 au drept caracteristica comuna faptul ca se bazeaza pe diferentele existente la cel mai general nivel, cel al metodologiei cercetarii in practica se intampla rar sa se ia decizii la acest nivel de generalitate, de aceea probabil ca 99% dintre cercetarile psihologice existente imbratiseaza paradigma dominanta, aceea a unui metodologii pozitiviste de tip cantitativ in acord cu aceasta stare de fapt a fost proiectata structura acestei carti, accentul fiind pus pe metodologia cantitativa de orientare pozitivista, pentru a putea raspunde fluxului principal de preocupari din domeniul cercetarii psihologice in schimb, clasificarea tipurilor de studii in cercetari experimentale vs cvasiexperimentale vs non-experimentale, vizeaza cel de-al doilea nivel de generalitate, cel al tipului de design al cercetarii Astfel ca in acest caz, spre deosebire de cazul celorlalte clasificari mentionate, cercetatorul joaca un rol activ in determinarea tipului de cercetare efectuata Acest lucru se intampla pentru ca la baza clasificarii studiilor in cele trei categorii se are in vedere nivelul de control exercitat de catre cercetator asupra variabilelor straine Cu cat se exercita un control mai drastic intr-un studiu asupra acestor variabile potential confundate, cu atat creste increderea in concluziile cercetarii respective in termeni tehnici exista doua masuri cu rol de control, cu caracter obligatoriu, care trebuie luate din perspectiva designului unei cercetari pentru a creste increderea in validitatea rezultatelor studiului Acestea privesc exercitarea unui control riguros asupra variabilelor potential confundate prin: (a) manipularea variabilei independente cu scopul de a varia efectul acesteia asupra variabilei dependente (de exemplu, se evalueaza doua forme diferite de interventie scolara menite sa diminueze abandonul scolar); (b) distribuirea aleatorie a participantilor la studiu in cele doua tipuri de interventie, cu scopul de a egaliza (controla) efectul pe care alte variabile potential confundate il poate avea asupra variabilei dependente Daca sunt indeplinite amandoua cerintele, vorbim despre studii experimentale Daca niciuna dintre conditii nu este indeplinita vorbim despre studii non-experimentale in sfarsit, daca doar conditia (a) este indeplinita vorbim despre studii cvasiexperimentale Acestea mai sunt cunoscute si sub denumirea de studii experimentale "slabe", fiind incadrate de anumiti autori in categoria generala a experimentelor, ca urmare a rolului activ pe care il joaca cercetatorul prin manipularea variabilei independente (Shadish et al , 2002) Detalii suplimentare despre studiile experimentale (inclusiv cele cvasiexperimentale), respectiv despre studiile non-experimentale sunt oferite pe larg in capitole distincte ale acestei carti (capitolele 5 si 6) Am rezervat acest spatiu larg de prezentare a caracteristicilor acestor tipuri de studii datorita impactului ridicat pe care il au asemenea informatii in dezvoltarea gandirii critice cu referire la calitatea unei cercetari si in planificarea studiilor empirice din psihologie Aceste competente tehnice sunt esentiale in realizarea de cercetari, fiind fundamentale pentru planificarea si derularea in bune conditii a unui studiu 3 3 5 Cercetari exploratorii vs cercetari descriptive vs cercetari cauzale Distinctia dintre studii experimentale si cele non-experimentale este prezenta in orice manual introductiv de psihologie experimentala metodologia cercetarii in schimb, mai putin cunoscuta este o alta taxonomie importanta pentru dezvoltarea gandirii critice legate de cercetari, ce are in vedere clasificarea lor in functie de tipul de obiectiv vizat de studiu (scopul studiului) Clasificarea cercetarilor in functie de tipul de obiectiv vizat de studiu este esentiala, deoarece, asa cum remarca Brewer (2000), evaluarea validitatii unui studiu, adica a nivelului de adevar al afirmatiilor rezultate in baza studiului, nu se face per se, ci in functie de tipul de obiectiv urmarit De aceea, cu cat obiectivul este unul mai ambitios (de exemplu, sa explice de ce apare un fenomen, nu doar sa-l descrie), cu atat sunt necesare mai multe masuri de control la nivelul designului studiului Prin urmare, tipul de obiectiv studiat are impact direct asupra designului ales (de exemplu, studiul non-experimental de tip corelational etc ) Tabelul 3 3 ofera o descriere succinta a tipurilor de cercetari in functie de obiectivul studiului, iar figura 3 2 ofera o privire de ansamblu asupra legaturii dintre cele doua clasificari avute in vedere (3 3 4 si 3 3 5), luand in considerare alte consecinte majore implicate la nivel de design (evaluate la un nivel inferior [mai concret] de analiza decat cel mentionat in sectiunea 3 3 4) Tabelul 3 3 Tipuri de studii din perspectiva obiectivului cercetarii O privire sintetica Clasificare dupa Descriere succinta (tipuri de intrebari ale cercetarii vizate) obiectivul vizat 1 Exploratoriu Se refera la studii bazate pe metodologii calitative (mai frecvent) sau pe metodologii cantitative asupra unei teme despre care nu se cunoaste nimic sau se cunosc foarte putine lucruri Doua atribute specifice ale acestor studii sunt: (a) studiul nu are prestabilite ipoteze care sa fie testate (de aici caracterul explorator); (b) desi are libertatea de a-si propune, fie sa descrie, fie sa prezica, fie chiar sa ofere explicatii pentru fenomenele studiate, concluziile din aceste studii sunt provizorii (nu permit stabilirea cu claritate a valorii de adevar a concluziilor studiului) Aceste concluzii provizorii pot deveni ipoteze de cercetare ce urmeaza a fi testate in studii ulterioare 2 Descriptiv Se refera la studii bazate preponderent pe metodologii de tip cantitativ, non-experimentale (observationale), realizate cu scopul de a descrie cat mai acurat fenomenul studiat prin cercetari de teren ("care este prevalenta cazurilor de ADHD printre adolescentii cu parinti plecati la munca in strainatate?" (2A), "cate subtipuri de 2A Descriptiv propriu-zis ADHD exista?" (2A), "care sunt modalitatile adaptive, respectiv dezadaptive de raspuns (coping) in situatiile de epuizare emotionala?" (2A), "exista o legatura intre nivelul de agresivitate si cognitiile irationale autodepreciative?" (2B), "nivelul stimei 2B Analitic de sine al persoanelor care au suferit un esec scolar este mai redus decat cel din lotul celor fara esec scolar etc " (2B) in cazul subtipului "studii descriptive propriu-zise" (2A), analizele statistice efectuate se rezuma la indicatori descriptivi, nefiind formulate ipoteze de cercetare Printre cele mai intalnite studii de acest gen sunt studiile de caz , sondajele de opinie si studiile bazate pe metoda observatiei in cazul subtipului de obiective descriptive analitice (2B), studiile efectuate contin ipoteze de cercetare verificate prin intermediul tehnicilor statistice inferentiale Cel mai frecvent, pentru a raspunde la aceste obiective se apeleaza la studiile non-experimentale de tip corelational sau la cele de tip comparativ, non-experimental (case control studies) Pornind de la descrierea asocierilor observate, studiile descriptiv-analitice permit formularea de predictii, de exemplu, cu privire la relatia dintre variabila studiata si alte variabile de interes (de exemplu, identificarea factorilor de risc care contribuie la aparitia anxietatii sociale) identificarea predictorilor nu este insa echivalenta cu identificarea cauzei pentru aparitia fenomenului avut sub observatie, deoarece predictorul poate juca orice rol in asocierea cu criteriul de interes, inclusiv cel de variabila confundata De exemplu, daca nivelul de studii (numarul de ani de scoala) prezice preferinta pentru un anumit post muzical de radio, ca urmare a asocierii dintre cele doua variabile, nu inseamna insa ca educatia reprezinta si sursa (cauza) acestei preferinte 3 Cauzal Se refera, in exclusivitate, la studii bazate pe o metodologie cantitativa riguroasa, (experimente si, eventual, cvasiexperimente) interesate de identificarea unor relatii cauzale si a unor explicatii (mecanisme cauzale) responsabile pentru aparitia efectului urmarit Prin acest tip de obiective se trece dincolo de simpla descriere a unui 3A Cauzal- comportament (fenomen), accentul fiind pus pe oferirea de explicatii pentru dinamica descriptiv comportamentului studiat in cercetarea aplicata, axata pe aspecte de utilitate, un scop de tip cauzal-descriptiv este suficient Cu ajutorul experimentelor se vizeaza doar demonstrarea unei relatii de tip 3B Cauzal- cauza-efect ("coaching-ul cognitiv-comportamental este eficient in reducerea stresului explicativ ocupational"), fara a valida stiintific explicatia pentru care acest lucru se intampla in cercetarea fundamentala, axata pe a gasi explicatii (de ce este coaching-ul cognitiv-comportamental eficient in diminuarea stresului ocupational?), se apeleaza la scopuri cauzal-explicative, care urmaresc sa expliciteze mecanismul cauzal in acest caz, accentul este pus pe demonstrarea relatiei cauzale, dar mai ales pe explicarea (identificarea) ingredientului activ ("de ce si in ce context functioneaza relatia cauzala?") Figura 3 2 implicatii in alegerea tipului de studiu in functie de designul cercetarii si de scopul urmarit Se observa, ca aspect de principiu, ca obiectivul (scopul) unui studiu poate fi atins numai prin anumite tipuri de studii, in functie de particularitatile designului pe care il implica acesta Bunaoara, in cazul studiilor cu obiective de tip descriptiv sunt disponibile mai multe alternative de studiu, din categoria celor care prezinta un design non-experimental De exemplu, pentru a descrie relatia dintre doua variabile, cum ar fi daca exista o asociere intre satisfactia in relatia de cuplu si nivelul de romantism, este suficient sa apelam la un studiu corelational, ca model potrivit pentru scopuri de tip descriptiv-analitic Nu este nevoie sa apelam la designuri mai complicate si mai costisitoare, de tipul studiilor cu design experimental, pentru ca se poate raspunde la intrebare si prin studii mai usor de implementat, cum sunt cele cu un design non-experimental De asemenea, este mai putin util sa se apeleze la studii care urmaresc obiective exploratorii, deoarece concluziile obtinute prin aceste studii au un caracter provizoriu, generand ipoteze care ar trebui validate ulterior prin alte studii cu scop descriptiv in schimb, daca ceea ce se urmareste prin studiu este de a identifica o posibila relatie cauzala, studiul corelational se dovedeste a fi insuficient pentru ca nu poate transa clar sursa corelatiei observate (care dintre urmatoarele variante este mai apropiata de adevar): (a) in relatiile de cuplu cu un nivel ridicat de satisfactie apar mai frecvent dovezi de romantism (satisfactia maritala cauzeaza intensificarea romantismului); (b) prin cresterea frecventei actelor romantice sporeste satisfactia maritala (romantismul conduce la o satisfactie maritala mai mare); (c) intre cele doua variabile exista o interconditionare reciproca, asemenea unui cerc "virtuos" (pe masura ce sporesc comportamentele romantice creste satisfactia maritala, iar aceasta induce, la randul ei, o predispozitie spre si mai multe comportamente romantice etc ); (d) ambele variabile studiate sunt efecte ale duratei relatiei de cuplu (cuplurile formate mai recent percep un nivel mai ridicat de romantism si un nivel mai ridicat al satisfactiei in relatia de cuplu) Pentru a elimina dintre variantele mentionate pe acelea care nu sunt sprijinite de date, va trebui sa adoptam un alt tip de studiu decat cel corelational transversal De pilda, pentru a observa gradul de sprijin existent pentru cele mentionate la punctul (d), ar fi util un studiu longitudinal care ar presupune urmarirea pe o anumita perioada de timp a modului in care variaza cele doua variabile, pe masura ce durata relatiei de cuplu creste insa cea mai buna varianta de a verifica daca exista o relatie de tip cauzal este apelul la studii experimentale, daca acestea sunt permise din punct de vedere etic in exemplul oferit ar putea fi verificata astfel doar varianta (b), deoarece nivelul comportamentului romantic poate fi manipulat experimental, in schimb ar fi inadecvat din punct de vedere etic sa manipulam nivelul satisfactiei in relatia de cuplu Spre exemplu, participantii la un asemenea studiu ar putea fi distribuiti randomizat in doua grupe experimentale: una care sa cuprinda persoane care sunt instruite de catre un consilier de cuplu cum anume sa-si surprinda partenerul prin acte romantice, ceilalti inclusi intr-un grup de tip placebo (discutii purtate cu consilierii de cuplu despre problemele lor maritale, cu scopul de a facilita catarsisul; consilierii rezumandu-se la un rol suportiv, asemenea unui prieten) Daca la finalul interventiei primul grup (cel care a deprins si exersat abilitatea de a se comporta in mod romantic fata de partener) va avea un nivel mai ridicat de satisfactie in relatia de cuplu decat cel de-al doilea grup, exista dovezi empirice cu privire la rolul cauzal pe care il joaca comportamentul romantic in cresterea satisfactiei fata de relatia de cuplu Atunci cand apelul la studii experimentale nu este posibil (din motive etice sau logistice), se pot apela la variante de suplinire cum sunt studiile cvasiexperimentale sau studiile longitudinale (vezi liniile intrerupte din figura 3 2) Acestea pot oferi indicii in sprijinul sau impotriva unei relatii de tip cauzal, insa nu sunt la fel de sigure precum studiile experimentale in identificarea unei relatii cauzale in cazul in care o asemenea relatie cauzala este sprijinita empiric, cercetarile ulterioare isi pot propune obiective de tip explicativ pentru a identifica mecanismele cauzale responsabile pentru efectul observat in exemplul nostru ipotetic, daca se demonstreaza experimental ca comportamentul romantic determina o crestere a satisfactiei maritale, se pot concepe studii de tip experimental care sa ofere explicatii valide pentru aceasta relatie cauzala Orice alt tip de studiu, in afara celui experimental, nu beneficiaza de suficienta rigurozitate metodologica pentru a elimina probleme specifice variabilelor cu potential confundat Spre exemplu, printre explicatiile posibile pentru relatia cauzala constatata putem identifica: (a) comportamentele romantice conduc la intensificarea perceptiei ca partenerul ne iubeste sincer, iar acest lucru conduce la o crestere a satisfactiei maritale (afectivitatea receptionata ca factor explicativ pentru cresterea satisfactiei maritale in urma comportamentelor romantice); (b) relatia cauzala este determinata de activarea normei de reciprocitate in cazul partenerului (comportamentul nostru romantic conducand la reactii pozitive din partea partenerului, care la randul lui raspunde prin gesturi pozitive, fapt care conduce la o intensificare a satisfactiei cu privire la relatia de cuplu - norma de reciprocitate ca factor explicativ pentru cresterea satisfactiei maritale in urma adoptarii unui comportament romantic) Seria de posibile explicatii alternative pentru relatia cauzala identificata ar putea continua Ceea ce ne intereseaza aici este sublinierea faptului ca singura modalitate de a trece de la nivelul speculativ de enumerare a unor posibile explicatii pentru relatia cauzala identificata la stadiul de a valida stiintific (de a stabili valoarea de adevar a acestor explicatii) este apelul la studii experimentale, in care sa fie manipulate, pe rand, explicatiile propuse ideal, ar putea fi propuse studii in care sa fie testate (comparate direct) doua sau mai multe asemenea explicatii posibile, insa daca acest lucru nu este posibil, explicatiile respective pot fi evaluate succesiv, printr-o serie de studii experimentale Nu vom insista aici asupra dezvoltarii exemplului mentionat in cazul unor studii cu obiective explicative, deoarece cititorii interesati pot gasi o asemenea ilustrare in caseta 4 2 (din capitolul 4) in schimb, vom preciza doua caracteristici ale demersurilor de tip cauzal-explicativ, mentionate de Shadish et al (2002): tendinta spre abordare moleculara in locul uneia molare, respectiv tendinta spre abordarea multinivelara Prima se refera la tendinta intalnita de a descompune factorul-cauza in subcomponente pentru a diferentia care anume dintre ingredientele respective reprezinta factorul activ Daca in cercetarea cu scop cauzal-descriptiv abordarea molara este suficienta (de exemplu, de a arata ca terapia rational emotiva este eficienta in combaterea depresiei), in cercetarea in scop cauzal-explicativ se cauta a se evidentia ce anume din ceea ce se realizeaza in cadrul terapiei rational-emotive reprezinta mecanismul schimbarii, fiind responsabil pentru ameliorarea simptomatologiei depresive ("este vorba doar de un factor comun, cum ar fi increderea in psihoterapeut?" sau "sunt anumite elemente specifice cum ar fi modificarea cognitiilor irationale autodepreciative?" etc ) identificarea elementului activ sau a setului de elemente active este un aspect esential, nu numai pentru procesul cunoasterii in sine (faciliteaza dezvoltarea de noi teorii cu privire la modul de functionare psihica), ci si pentru a putea proiecta interventii optimizate (care sa valorifice mai bine ingredientele active responsabile pentru efectul dorit, cum ar fi o varianta de psihoterapie rational-emotiva care sa accentueze exercitiile de disputare si modificare a cognitiilor irationale autodepreciative in unele rationale, daca se dovedeste ca aceste cognitii stau la baza concluziilor din studiile experimentale focalizate spre a arata de ce psihoterapia rational-emotiva este eficienta in combaterea depresiei Cea de-a doua caracteristica specifica abordarii cauzal-explicative vizeaza abordarea multinivelara Astfel, mecanismele cauzale analizate pot viza niveluri diferite de generalitate, respectiv de focalizare pe aspecte implementationale (biologice) in exemplul amintit pot fi cautate explicatii de sorginte neuropsihologica (modificari la nivelul unor neurotransmitatori chimici), de natura psihologica abstracta (nivelul general de irationalitate cognitiva) sau de natura psihologica concreta (cognitiile irationale de tip autodepreciative) De asemenea, explicatiile pot viza diferite cadre conceptuale (raportarea la diferite teorii), in functie de teoria psihologica imbratisata de cercetator, putand fi oferite explicatii de sorginte psihodinamica, a terapiei familial-sistemice etc Acestea pot fi considerate valide, atata timp cat sunt sprijinite empiric de studii care utilizeaza un design adecvat (in speta de fata, unul experimental) pentru a raspunde obiectivului studiului, acela de a oferi explicatii valide stiintific pentru relatia cauzala observata Un alt aspect care ar trebui subliniat cu privire la figura 3 2 vizeaza pleiada de studii care fac apel la un design non-experimental Numarul de studii care apeleaza la un design non-experimental este mai mare decat cel prezentat in figura respectiva (de exemplu, lipsesc studiile care apeleaza la o metodologie calitativa) Capitolul 5 este destinat descrierii acestei categorii de studii denumite generic studii non-experimentale Ceea ce ar trebui subliniat aici este faptul ca studiile bazate pe un design non-experimental pot fi utilizate interschimbabil, in genere, atat pentru obiective de tip descriptiv, cat si pentru cele de tip explorativ De exemplu, studiul de caz, asa cum remarca si Kazdin (2010), se poate dovedi util atat in scopuri exploratorii (ca sursa de idei si ipoteze pentru studii viitoare), cat si in scopuri descriptive propriu-zis (pentru a ilustra, in scop educational sau de advocacy, cazuri particulare in sprijinul unei teorii sau unei interventii psihologice; pentru a descrie aspecte psihologice rar intalnite) De asemenea, un tip aparte de studii non-experimentale (studiile longitudinale dintre care cel mai intalnit tip sunt studiile pe cohorte) poate fi utilizat pentru a infera afirmatii de tip cauzal, atunci cand datele experimentale lipsesc sau nu pot fi colectate din motive etice sau logistice Acest lucru este posibil pentru ca una dintre premisele unei relatii de tip cauza-efect este aceea de a observa ca modificarile la nivelul variabilei-cauza preceda temporal modificarile la nivelul variabilei-efect, iar observarea acestui lucru este posibila doar intr-un design longitudinal, ce presupune observarea evolutiei participantilor la studiu de-a lungul timpului La finalul acestei sectiuni merita sa subliniem caracterul cumulativ al cunoasterii, cu implicatii asupra tipului de studii care ar trebui utilizate in functie de stadiul cunoasterii in cazul temei studiate Astfel, studiile care urmaresc un obiectiv cauzal-explicativ nu isi au sensul pana cand nu exista dovezi ale existentei unei relatii cauzale, abordabila prin obiective de tip cauzal-descriptiv De asemenea, nu are rost sa cautam a identifica relatii de tip cauza-efect ca atare (obiectiv descriptiv) in absenta unor dovezi cu privire la existenta unei relatii in sfarsit, in multe cazuri, inainte de a avea studii descriptive cu un demers coerent (in care sa stim ce sa cautam) ar fi util sa apelam la studii exploratorii pentru a ne face o impresie despre ce anume sa studiem ulterior intr-o maniera sistematica Cu alte cuvinte, desi experimentele sunt cele mai riguroase din punct de vedere metodologic, ele sunt cele mai dificil de implementat si nu isi au sensul in absenta unor dovezi empirice deja existente cu privire la descrierea fenomenului studiat in consecinta, studiile experimentale in psihologie sunt mai potrivite pentru a adresa intrebari de cercetare mature, in timp ce studiile de tip non-experimental sunt utile pentru a strange, mai degraba intr-o maniera nesistematica, acea cantitate de informatii necesara pentru a permite saltul in cunoasterea domeniului atat prin evaluari sistematice sau narative ale literaturii de specialitate din domeniu, cat si prin trecerea la nivelul urmator de interes al oricarui demers stiintific, cum ar fi trecerea de la descriere catre predictie si catre oferirea de explicatii pentru problema studiata 3 4 Aprecierea validitatii afirmatiilor din studiile efectuate in esenta apelam la stiinta ca sursa a cunoasterii in defavoarea oricarei alte surse de cunoastere (apelul la autoritatea academica, la convingeri personale etc ) pentru ca ne asteptam ca prin apelul la demersul stiintific sa ajungem sa cunoastem realitatea (raspunsul corect la intrebarea de cercetare adresata) si sa formulam concluzii solide, fundamentate despre problematica studiata Validitatea unei cercetari se poate referi, in cazuri rare, la studiul in ansamblul sau (daca designul utilizat este total inadecvat pentru a raspunde la intrebarea adresata prin cercetare), insa cel mai frecvent are in vedere orice afirmatie extrasa in baza cercetarii realizate, apreciind masura in care studiul respectiv, prin caracteristicile sale metodologice, poate acoperi valoarea de adevar a afirmatiei in cauza (se poate stabili fara doar si poate ca afirmatia respectiva este una adevarata, valida) De aceea, asa cum afirma Brewer (2000), discutia despre validitate nu se refera la cercetarea in sine, ci priveste mai degraba validitatea studiului in raport cu obiectivul urmarit prin studiu (vezi caseta 3 1) Caseta 3 1 ilustrari ale impactului pe care obiectivul urmarit (si implicit tipul de studiu) il are asupra validitatii afirmatiilor rezultate din studiu Exemplul 1 identificarea masurii in care exista o legatura intre nivelul de violenta din desenele animate urmarite si nivelul de agresivitate al copiilor (context: studiu non-experimental transversal de tip corelational implementat corect, cu rezultate ce indica o asociere semnificativa statistic) Obiectiv vizat: descriptiv-analitic Rezultat: nivelul de agresivitate al copiilor coreleaza pozitiv cu gradul de violenta din continutul desenelor urmarite Concluzie (afirmatie) valida in baza observatiei: fiind un studiu corelational, nu se poate stabili clar sursa acestei asocieri Astfel este posibil fie ca desenele cu un continut violent sa induca o crestere a nivelului de agresivitate in randul copiilor, fie sa asistam la un efect al autoselectiei, prin care copiii cu un nivel mai ridicat de agresivitate sa prefere sa urmareasca mai frecvent desene cu continut violent, deoarece acestea le raspund mai bine nevoilor Concluzie (afirmatie) nevalidata in baza observatiei (studiul efectuat nu poate stabili daca este corecta sau nu afirmatia respectiva): acest rezultat sprijina pozitia grupurilor de advocacy de a condamna continutul violent din desene animate, observandu-se ca nivelul violentei creste pe masura ce sunt vizionate mai multe desene cu continut violent Explicatia pentru aceasta stare de fapt este aceea ca copiii invata ca actele violente pot constitui un mod uzual de comportament soldat cu succes (agresivitatea ca mijloc instrumental in atingerea scopului dorit) Exemplul 2 Demonstrarea unei relatii cauzale, conform careia desenele animate cu un continut violent determina cresterea nivelului de agresivitate la copii (context: studiu experimental implementat corect, cu rezultate ce indica diferente semnificative intre cele doua grupe, in directia asteptata) Obiectiv vizat: cauzal-descriptiv Rezultat: un nivel mai ridicat al agresivitatii masurate posttest in grupul experimental (cei care au vizionat desene cu continut violent) decat in grupul de control (cei care au vizionat desene fara continut violent) Concluzie (afirmatie) validata* **: datele obtinute sprijina ideea ca desenele cu un continut violent induc agresivitate in randul copiilor Acest rezultat sprijina pozitia grupurilor de advocacy de a condamna continutul violent din desene animate Concluzie (afirmatie) nevalidata: explicatia pentru aceasta stare de fapt este aceea ca copiii invata ca actele violente pot constitui un mod uzual de comportament soldat cu succes (agresivitatea ca mijloc instrumental in atingerea scopului dorit) * Am semnalat prin asterisc cazul respectiv pentru ca doar apelul la un design potrivit (de exemplu, un studiu experimental) nu este suficient pentru a valida afirmatii cauzale Este la fel de important ca implementarea sa fie una corecta De pilda, daca studiul este efectuat pe baieti, iar grupul experimental urmareste desene din seria Ben 10, in timp ce copiii din grupul de control vizioneaza Bambi, diferentele constate pot fi determinate de alte variabile confundate (cum ar fi nivelul de atractivitate, respectiv de familiaritate diferit pentru cele doua desene, mai ridicat pentru Ben 10 in cazul baietilor) sau de gradul diferit de similaritate dintre jucariile avute la dispozitie si personajele din desene (variabila dependenta fiind masurata prin observarea comportamentului copilului prin joc, ulterior vizionarii desenului) Astfel, daca in gradinita sunt mai degraba jucarii din seria Ben 10 sau alte personaje extraterestre similare, dar nu exista caprioare sau alte personaje incluse in Bambi, exista riscul ca efectul observat sa fie ca urmare a facilitarii ridicate a transferului unor scenarii din desene in jocul de rol al copiilor in favoarea celor pentru care exista recuzita necesara Cu alte cuvinte, este important ca manipularea experimentala sa fie una adecvata pentru a surprinde factorul cauzal anticipat si pentru a controla alte variabile potential confundate (de exemplu, ar fi potrivit a se apela la doua episoade din acelasi serial de desene [aceleasi personaje de baza], unul cu continut violent, altul fara violenta) ** Cu toate masurile de control ce pot fi luate pentru a elimina o serie de riscuri la adresa validitatii unui studiu, este imposibil sa fie acoperite toate situatiile posibile, motiv pentru care: (a) niciun studiu nu poate atinge perfectiunea (lipsa totala a oricarui risc privitor la validitatea concluziilor sale); de exemplu, apelul la studii randomizate controlate, desi necesar pentru a urmari un obiectiv de tip cauzal-descriptiv sau cauzal-explicativ, nu constituie o garantie pentru validitatea afirmatiilor ce fac referiri la aspecte cauzal-descriptive sau cauzal-explicative; (b) ideea de valoare de adevar (rezultat valid) trebuie privita in termeni probabilistici (este foarte probabil ca afirmatia sa fie una valida, adevarata), nu in termeni absoluti De aceea, in redactarea acestei sectiuni, pe care o consider fundamentala pentru a intelege esenta demersului de cercetare si a permite evaluarea contributiei aduse de diferite studii, am apelat atat la surse clasice, cat si la surse complementare Dintre sursele clasice care trateaza problematica validitatii se disting contributiile lui Shadish et al (2002) sau Cook si Campbell (1979), in special in descrierea principalelor riscuri privitoare la validitatea concluziilor unui studiu experimental sau cvasiexperimental insa, dincolo de aceasta discutie generala despre validitatea unei cercetari, vom introduce in discutie surse complementare precum Kazdin (2010), al carui principal merit este de a prezenta riscuri mai putin cunoscute privitoare la validitatea concluziilor unui studiu, dar importante din perspectiva psihologiei validate stiintific (fundamentate empiric), cum sunt efectul de noutate sau planificarea asincrona a evaluarilor, atunci cand se apreciaza validitatea eficientei unei interventii Mai mult, pornind de la afirmatia repetata cu mai multe ocazii pe parcursul acestei carti, aceea ca nu este posibil sa fie realizata o cercetare "perfecta", lipsita de riscuri privitoare la validitatea concluziilor sale, voi aprofunda discutia despre validitatea unui cercetari in functie de obiectivul studiului respectiv Tipurile de validitate discutate au importanta diferita in functie de scopul studiului De exemplu, pentru un studiu experimental ce isi propune un obiectiv cauzal-descriptiv, esential este ca acesta sa raspunda indeosebi aspectelor de validitate interna (demonstrarea relatiei cauza-efect) si secundar aspectelor care tin de validitatea externa (nivelul de generalizare a relatiei cauzale observate in alte contexte) in schimb, intr-un studiu non-experimental ce isi propune un obiectiv descriptiv, de tipul sondajului de opinie, se acorda o importanta mai mare aspectelor ce tin de validitatea de construct, respectiv cea externa, preocuparea fiind foarte redusa pentru problematica validitatii interne, pentru ca prin definitie aceasta ar urmari nivelul de adevar al inferentelor cu referire la relatii de tip cauzal, aspect care nu poate fi surprins adecvat prin intermediul unui sondaj de opinie in consecinta, dincolo de prezentarea principalelor tipuri de validitate, ne propunem in sectiunea de fata sa extindem viziunea prezentata de Brewer (2000), cu privire la impactul pe care scopul urmarit de un studiu il are asupra evaluarii cercetarilor din perspectiva nivelului lor de validitate Aceste informatii vor fi utile atat in proiectarea cercetarilor viitoare (anticipand posibile probleme cu interpretarea rezultatelor in functie de caracteristicile studiului efectuat), cat si in identificarea punctelor tari si a punctelor slabe pentru studiile deja efectuate Tabelul 3 4 Tipuri de validitate (adaptare dupa Shadish et al , 2002) Tipuri de validitate Descriere succinta (tipuri de afirmatii vizate) Validitate statistica Se refera la: (a) validitatea inferentelor statistice efectuate (masura in care au fost evitate erori de tip i sau de tip ii in testarea ipotezelor) si la (b) increderea in magnitudinea efectului observat Validitate interna Se refera la validitatea inferentelor conform carora relatia observata intre A si B reflecta situatia unei relatii cauzale (in ce masura putem fi siguri ca A il determina pe B si nu sunt alte variabile confundate responsabile pentru efectul B) Validitate de construct Se refera la masura in care caracteristicile de baza ale studiului (variabile, participanti etc ) reprezinta operationalizari potrivite pentru a surprinde constructele teoretice vizate Validitate externa Se refera la masura in care rezultatele obtinute pot fi generalizate pe alti participanti, alt context de cercetare sau alte instrumente de cercetare ce se refera la aceleasi constructe Cu alte cuvinte se refera la gradul de generalizare a rezultatelor (aceleasi rezultate ar fi obtinute in alte studii similare) 3 4 1 Validitatea statistica in limbaj simplu, aceasta forma de validitate este valabila pentru orice tip de studiu care utilizeaza o metodologie cantitativa si indeosebi pentru cele care apeleaza la formularea si testarea unor ipoteze de cercetare (de exemplu, studii avand un scop descriptiv-analitic) Mai concret, validitatea statistica are in vedere valoarea de adevar a inferentelor legate de: (a) masura in care rezultatul semnificativ sau nesemnificativ statistic este unul corect (evitarea erorilor de tip i sau ii, aspect dependent de puterea statistica a studiului); (b) masura in care marimea efectului observat in studiu este corect apreciata (efectul nu este supra- sau subestimat, respectiv increderea in valoarea obtinuta) Dintre multiplele riscuri care pot afecta validitatea statistica se distinge indeosebi situatia unei puteri statistice scazute de testare a ipotezelor Puterea statistica scazuta reduce probabilitatea de a obtine rezultate semnificative statistic, cand in realitate ar exista un asemenea efect, situatie cunoscuta sub numele de eroare de tip ii Puterea statistica scazuta poate fi cauzata de o multitudine de factori (vezi Sava 2004 2011), dintre care cel mai cunoscut este numarul insuficient de participanti cuprinsi in studiu Pentru a creste puterea statistica a studiului, pe langa cresterea volumului esantionului studiat, se poate apela la masuri de ordin metodologic precum: (a) utilizarea unui design intragrup in locul unuia de tip intergrup; (b) preferinta, in cazul studiilor comparative, pentru designuri paralele cu mai mult de doua grupe; (c) apelul la studii randomizate stratificate (randomized blocked design) in locul studiilor randomizate complet (completely randomized design) pentru a reduce eterogenitatea participantilor comparati, cu conditia ca variabila utilizata pentru stratificare potrivire sa fie una care coreleaza cu variabila dependenta; (d) utilizarea unor designuri cu numar egal de subiecti in celulele experimentale etc (Shadish et al , 2002; Sava, 2004 2011) Pe langa masurile de ordin metodologic, trebuie avuta grija si de aspectele statistice Tabelul 3 5 contine o sinteza a celor mai des intalnite riscuri in cazul validitatii statistice, atat prin impactul pe care il au asupra puterii statistice (scad puterea statistica), cat si prin riscul de distorsiune legat de magnitudinea efectului observat (de exemplu, subestimarea efectului) Tabelul 3 5 Riscuri privitoare la validitatea statistica Riscuri privitoare la validitatea statistica prin impactul lor asupra puterii statistice si a acuratetei magnitudinii efectului Restrictia de amplitudine Exemplificare: intr-un studiu ce vizeaza relatia dintre constiinciozitate si performanta angajatilor din spital se observa absenta corelatiei dintre cele doua variabile La o analiza mai atenta se observa restrictii de amplitudine in cazul ambelor variabile De exemplu, desi scala de masurare a constiinciozitatii lua valori intre 0 (nivel foarte scazut) si 20 (nivel extrem de ridicat al constiinciozitatii), rezultatele colectate de la participanti au continut scoruri cuprinse intre 13 si 18 puncte, astfel ca toti subiectii testati au un nivel mediu superior al constiinciozitatii) in mod similar, desi existau 5 trepte de clasificare a performantei (de la 1 [mult sub asteptari] la 5 [mult peste asteptari]) s-a constatat ca peste 95% dintre participanti au primit calificative de 4 sau 5 si niciunul dintre candidati nu a primit un scor de 1 sau 2 O astfel de situatie, in care exista o variabilitate scazuta a scorurilor, poarta numele de restrictie de amplitudine si se soldeaza cu o diminuare puternica a indicatorului statistic calculat (de exemplu, coeficienti scazuti de corelatie), fapt ce contribuie la aparitia unui risc crescut de a comite o eroare de tip ii, respectiv la subestimarea legaturii dintre variabile Efectul negativ apare atunci cand una sau amandoua dintre variabilele analizate sufera de restrictie de amplitudine Tot in cadrul restrictiei de amplitudine as aminti despre efectul de podea (floor effect), respectiv de tavan (ceiling effect) O ilustrare a efectului de tavan ar fi propunerea de a testa eficienta unei metode noi de predare a matematicii fata de metoda clasica la doua clase speciale de matematica (cu un nivel mediu al performantei la matematica la pretest de 9,20 in clasa A, respectiv de 9,25 in clasa B) Chiar daca metoda ar fi una benefica, nu exista un spatiu mare de crestere, astfel incat o posibila crestere cu 50 de sutimi (de la 9,20 la 9,70) ar fi insuficienta pentru a obtine rezultate semnificative statistic, in ipoteza mentinerii aceluiasi scor de 9,25 pentru clasa B) Daca nivelul de la care s-ar fi pornit ar fi fost unul mai scazut (de exemplu, o medie de 7,50), ar fi fost posibila o crestere mai mare dupa implementarea noii metode (de exemplu, de 1,50 puncte), suficienta pentru a conduce, de aceasta data, la diferente semnificative intre grupe Efectul de podea se refera la o situatie opusa De exemplu, intr-un studiu se urmareste eficienta unei tehnici de diminuare a agresivitatii, testata pe participanti cu agresivitate scazuta (marja de scadere este prea mica pentru a sesiza efectul) Consistenta interna scazuta Exemplificare: intr-un studiu se compara daca exista diferente intre grupul experimental si lotul de control cu privire la nivelul anxietatii sociale Aceasta variabila a fost masurata printr-o scala a carei consistenta interna este scazuta (alfa Cronbach fiind 0,46) Restul aspectelor implicate in cercetare au fost implementate corect Situatiile in care masuratorile esentiale pentru testarea ipotezei (cum este cazul VD in ipoteze ce vizeaza comparatii intre grupe) au niveluri scazute ale consistentei interne, ne indeamna sa fim extrem de precauti si sa avem o incredere scazuta in acuratetea scorurilor obtinute, din cauza erorii de masurare ridicate Din punct de vedere statistic, situatia conduce la cresterea riscului de aparitie a erorii de tip ii si la subestimarea legaturii dintre variabile incalcarea asumptiilor unui test statistic Exemplificare: intr-un studiu se urmareste daca exista o legatura intre venitul lunar al participantilor (exprimat in lei) si atitudinea oamenilor fata de demersul de suspendare a presedintelui Traian Basescu evaluata printr-o scala Likert in 7 trepte (1 - total impotriva, 7 - sprijin total) Datele colectate de la 300 de participanti (desi acopera intreaga plaja de raspunsuri pentru a evita restrictia de amplitudine), indica faptul ca cele doua variabile au o distributie puternic asimetrica (de exemplu, 90% dintre participanti au declarat venituri pana in 2 500 lei net, iar atitudinea privind demersul de suspendare era mai degraba favorabila, media fiind plasata la 5,75 in scala de 7 puncte) in exemplul descris, corelatia calculata pe aceste date brute va fi atenuata, conducand la efecte similare cu cele mentionate in primele doua situatii de mai sus Acest caz ilustrativ este numai unul din zecile de exemple posibile cu privire la situatia de incalcare a asumptiilor asociate unui anumit test statistic De exemplu, in cazul corelatiei Pearson, una dintre cele mai utilizate tehnici statistice, intre asumptiile de baza pentru a ajunge la un rezultat corect se afla: (a) existenta unei relatii liniare intre variabile; (b) aspectul homoscedastic al asocierii (omogenitatea relatiei dintre variabile); (c) absenta devierilor grave de la cazul unei distributii normale pentru variabilele analizate; (d) absenta cazurilor extreme (outliers) Pentru mai multe detalii despre acest subiect, vezi Sava (2004 2011) Aplicarea unui test statistic prin ignorarea asumptiilor (conditiilor necesare aplicarii acestuia) creste riscul de a comite atat erori de tip i, cat si erori de tip ii, in functie de problema ignorata Solutia pentru aceasta problema consta fie in corectarea problemelor respective acolo unde este posibil (de exemplu, transformarea scorurilor brute pentru a ameliora problemele de distributie anormala - vezi partea de final a capitolului 3 in Sava, 2004 2011), fie in aplicarea altor tehnici statistice Aglutinarea datelor Exemplificare: intr-un studiu privind relatia dintre nivelul de extravertire si nevoia de senzatii tari sunt colectate date numerice despre extraversiune printr-o scala de profil ce permite amplitudini ale scorurilor intre 0 si 36 Desi ar fi putut testa direct ipoteza vizata, cercetatorul decide sa imparta participantii testati in introvertiti, respectiv extravertiti, in baza mediei (cei cu scoruri sub medie fiind considerati introvertiti, iar cei cu scoruri peste medie, extravertiti) Acest gen de transformari, alaturi de alte variante de aglutinare (de exemplu, realizarea analizelor statistice nu pe baza scorurilor brute, ci pe baza scorului clasei obtinut in baza unui etalon - celebra fiind etalonarea in 5 clase: de la 1 - foarte scazut, la 5 - foarte ridicat) nu sunt indicate deoarece se pierde o informatie esentiala, ce poate conduce la distorsionarea rezultatelor si la efecte specifice restrictiei de amplitudine De exemplu, dihotomia rezultata in baza unui examen - admisi si respinsi - pierde din vedere diferentele intragrup (exista o distanta calitativa mai mare intre un individ admis cu 5,01 fata de un coleg notat cu 10,00, decat fata de un alt coleg din celalalt grup, al respinsilor, dar notat cu 4,95) Shadish et al (2002) trateaza aceasta situatie ca un caz special al restrictiei de amplitudine Raportarea selectiva a rezultatelor Exemplificare: intr-un studiu ce urmareste sa identifice dovezi cu privire la validitatea predictiva a unei probe de personalitate construite pe modelul Big-Five sunt analizate corelatiile dintre cele 5 dimensiuni de personalitate si un set de 100 de comportamente (cate 20 asociate fiecarei dimensiuni, notate de la 1 [deloc] la 4 [frecvent]) in urma prelucrarii statistice a rezultatelor, se constata ca doar in 15 cazuri din cele 100 de comportamente, rezultatele indica asocieri semnificative cu dimensiunile respective in directia asteptata in redactarea articolului, cercetatorul ia decizia de a include doar 20 de comportamente (cate 4 pentru fiecare dimensiune, intre care se regasesc toate cele 15 pentru care s-au obtinut asocieri semnificative statistic), ignorandu-le pe celelalte 80 de comportamente, al caror rezultat era nesemnificativ statistic in principiu, limitarea la prezentarea numai a acelor rezultate care spun o poveste interesanta este o practica incurajata chiar de editorii revistelor de specialitate, din lipsa de spatiu editorial Cu toate acestea, eliminarea selectiva a rezultatelor care nu convin distorsioneaza clar concluziile ce pot fi trase din studiu Prezentarea tuturor rezultatelor obtinute ar fi preferabila pentru a ne forma o impresie realista, corecta, asupra rezultatelor obtinute, dar si pentru a aprecia riscul de aparitie a erorii setului de comparatii (vezi discutia despre acest tip de eroare la inceputul capitolului 4 din Sava, 2004 2011) pentru a aprecia care este probabilitatea de a obtine din intamplare rezultate semnificative statistic, in contextul in care doar 15% dintre comportamente evaluate au fost asociate unui rezultat semnificativ statistic Daca prezentarea tuturor rezultatelor nu este posibila din motive editoriale, preferabil ar fi sa se apeleze la strategii complementare De exemplu, daca fiecare dimensiune de personalitate era asociata cu un set de 20 de comportamente, se poate pune accent pe prezentarea rezultatelor dintre relatia dintre dimensiunea respectiva si un scor compozit (global) al comportamentelor, cum ar fi media comportamentelor sau scorul factorial obtinut in urma includerii acestora intr-o analiza factoriala (a componentelor principale) Un avantaj suplimentar al acestei decizii este evitarea cazurilor de restrictie de amplitudine (de exemplu, in cazul insumarii celor 20 de comportamente rezultatul variabilei in cauza variaza teoretic intre 20 si 80, in timp ce in analizele bazate pe fiecare comportament in parte, variaza teoretic doar intre 1 si 4) Eterogenitate la nivel intragrupal Exemplificare: intr-un studiu interesat de stabilirea eficientei unui program de slabire cu ajutorul unor exercitii de imagerie mentala, nu s-au sesizat diferente semnificative intre grupul experimental (m = 72 kg, as = 30 kg) si grupul de control (m = 80 kg, as = 28 kg) in schimb, un alt studiu pe aceeasi tema identifica diferente semnificative statistic, sprijinind eficienta interventiei (m = 72 kg, as = 14 kg in grupul experimental, respectiv m = 80 kg si as = 12 kg in grupul de control) Desi diferenta dintre mediile celor doua grupe este aceeasi in cele doua studii, rezultatele sunt diferite! Esecul primului studiu de a gasi diferente semnificative statistic este determinat de o eterogenitatea prea mare a participantilor din grupele comparate, fapt reflectat prin niveluri ridicate ale abaterilor standard Astfel, este mai simplu de detectat o diferenta de 10 kg intre mediile celor doua grupe daca acestea sunt alcatuite din indivizi relativ omogeni (de exemplu, cantarind intre 85 si 95 de kg) decat din indivizi cu o greutate eterogena (de exemplu, cantarind intre 70 si 120 de kg) Morala: asa cum se vorbeste popular despre un colesterol bun si unul rau, la fel am putea afirma in cazul imprastierii datelor Aceasta poate fi benefica (in studii corelationale sau daca vorbim despre dispersia intergrup - diferentele dintre grupe) sau nociva pentru validitatea statistica a studiului (cazul dispersiei intragrup - diferente mari intre indivizii cuprinsi in acelasi grup) Eterogenitatea poate viza, fie variabila dependenta, fie variabile cu potential confundat, fie chiar modalitatile variabilei independente, cum este cazul implementarii unei interventii nestandardizate Apelul la tehnici statistice inadecvate Exemplificare: intr-un studiu s-a urmarit daca exista o asociere intre nivelul de inteligenta (operationalizat prin scorul iQ) si venitul lunar (operationalizat in lei net luna) Pentru aceasta, cercetatorul a apelat la tehnica hi patrat al gradului de omogenitate si a concluzionat ca nu exista o asociere semnificativa statistic Am lasat la final, poate cel mai evident risc privitor la validitatea statistica, aceea de a aplica o tehnica statistica gresita (nepotrivita), in cazul descris tehnica corecta fiind coeficientul de corelatie lineara Bravais-Pearson Desi asemenea cazuri sunt extrem de rare in literatura de specialitate publicata in reviste cu prestigiu international, am amintit de aceast risc pentru ca, din pacate, sunt inca intalnite ocazional in Romania, inclusiv in randul unor lucrari de doctorat sau al unor articole publicate in reviste de specialitate din tara 3 4 2 Validitatea interna Demonstrarea din punct de vedere statistic a unei asocieri intre doua variabile de interes este o conditie insuficienta pentru a putea infera relatii cauzale Cu alte cuvinte, nu orice corelatie semnificativa statistic este un rezultat al prezentei unei relatii de tip cauza-efect Pentru a demonstra existenta unei asemenea relatii cauzale, (a) pe langa demonstrarea unei asocieri semnificative statistic, (b) ar trebui sa se constate ca modificarile in variabila cauza preceda temporal modificarile observate in variabila efect, (c) in conditiile in care sunt eliminate alte explicatii alternative care ar putea fi responsabile pentru legatura respectiva (Shadish et al , 2002) Daca problema obtinerii unui indicator precis pentru relatia statistica dintre cele doua variabile este una de validitate statistica, iar aspectul temporalitatii (ordinea in aparitia modificarilor) poate fi obtinut destul de simplu prin design sau prin analiza logica , problema eliminarii explicatiilor alternative pentru a pastra doar explicatia cauzala drept sursa a legaturii dintre variabile este o problema de validitate interna De multe ori este posibil ca demersul statistic sa fie excelent realizat, insa sa existe erori in rationamentele cauzale utilizate pentru acest lucru Pentru a ilustra aceasta stare de fapt voi apela la un studiu cvasiexperimental ipotetic cu design pretest-posttest, fara grup de control intr-o iarna, un cercetator este interesat sa propuna un program bazat pe exercitii Yoga pentru a creste imunitatea organismului (operationalizat prin diminuarea numarului de raceli) Pentru aceasta apeleaza la un lot de 100 de voluntari pe care ii invata si ii monitorizeaza timp de sase luni in practicarea exercitiilor Yoga Din punct de vedere statistic, cercetatorul constata un numar semnificativ mai redus de raceli in ultima luna de monitorizare a exercitiilor comparativ cu situatia initiala, ce viza frecventa racelilor in luna premergatoare inceperii programului de antrenament Este acest rezultat suficient pentru a valida inferenta cercetatorului, ca prin antrenament Yoga se reduc problemele de sanatate, ca exercitiile sunt benefice pentru imunitatea organismului? Raspunsul, din perspectiva validitatii interne a acestui studiu, este desigur unul negativ atata timp cat pot fi oferite explicatii alternative plauzibile pentru rezultatul obtinut De pilda, o explicatia alternativa pentru diminuarea numarului de raceli poate fi data de aspectul sezonier al epidemiilor de raceala si gripa (mai des intalnite iarna - momentul evaluarii pretest, decat vara -momentul evaluarii posttest) O alta explicatie posibila vizeaza alimentatia Este posibil ca odata cu practicarea exercitiilor Yoga, participantii sa faca schimbari in tipul de alimentatie folosit si sa inceapa sa manance mai sanatos Prin urmare, ameliorarea observata la nivelul frecventei imbolnavirilor poate fi cauzata de noul regimul alimentar sanatos si nu de exercitiile Yoga De asemenea, rezultatul poate fi o consecinta a distorsiunii in selectia participantilor Este foarte posibil ca participantii care au acceptat sa fie voluntari in acest studiu cu o durata de sase luni sa inceapa sa manifeste o preocupare deosebita pentru sanatatea lor, ca urmare a unui istoric personal asociat unor imbolnaviri frecvente De aceea este posibil sa acorde mai multa grija mentinerii sanatatii (de exemplu, prin consum zilnic de vitamina C, alimentatie variata, program regulat de somn etc ), iar aceasta modificare sa fie cauza diminuarii frecventei racelilor inregistrate З 4 2 1 Problema celei de-a treia variabile Aceste exemple subliniaza un element comun si esential pentru problematica validitatii interne a unui studiu, denumita generic de Brewer (2000) drept "problema celei de-a treia variabile" si fiind sursa reala a relatiei observate dintre Vi si VD Desi, in principiu, validitatea interna ar trebui sa fie o problema specifica doar pentru studiile care urmaresc un obiectiv de tip cauzal (cele longitudinale, cele cvasiexperimentale si cele experimentale), ea poate fi adresata si in alte tipuri de studii, daca cercetatorii fac inferente de natura cauzala cu privire la rezultatele obtinute Bunaoara, prezentarea datelor provizorii pentru recensamantul din 2011 si discursul public insotitor pentru a explica rezultatele obtinute constituie o sursa bogata de discutie din perspectiva celei de-a treia variabile Spre exemplu, s-a observat ca exista o asociere intre judetele care au cunoscut cea mai mare scadere demografica fata de recensamantul din 2002 si existenta unor conditii igienice adecvate (cum ar existenta unei bai in locuinta) Astfel, in judetele a caror populatie a scazut cel mai mult se observa un procent mai scazut de gospodarii dotate cu baie in casa Din punct de vedere logic, este putin probabil ca aceasta asociere sa indice o relatie cauzala intre cele doua Mai mult, din punct de vedere metodologic este imposibil sa fie valide asemenea inferente cauzale, fiind vorba de un studiu descriptiv transversal, inadecvat pentru a raspunde la obiective de tip cauzal (deoarece nu poate adresa conditiile b si c necesare pentru a considera o relatie dintre variabile ca fiind una cauzala) Desigur, prin implicarea in ecuatie a altor variabile este posibil sa se ofere unele explicatii (provizorii) De exemplu, este posibil ca ambele variabile sa reprezinte doar efecte ale unei cauze comune Aceasta ar putea fi un nivel mai mare de saracie in judetele respective sau un procent mai ridicat al populatiei cu rezidenta in mediul rural etc Pentru ca atat saracia, cat si rezidenta in mediul rural pot fi facilitatori ai existentei unor bai in afara locuintei si ai mobilitatii demografice Acest tip de relatie, cum ar fi cea dintre pierderea populatiei din judete si absenta bailor in locuinta poarta denumirea in statistica de legatura falsa (spurious correlation), fiind prezentata in partea dreapta a figurii 3 3 Complexitatea problemei celei de-a treia variabile este descrisa in figura 3 3 De exemplu, daca ne raportam la partea stanga a figurii si daca notam cu X antrenamentul Yoga, cu Y frecventa racelilor si cu C alimentatia sanatoasa, putem observa ca inferenta "Yoga ajuta la diminuarea frecventei racelilor" nu reprezinta o cauza reala, desi statistic poate exista o legatura intre ele Se ajunge la aceasta afirmatie eronata, pentru simplul fapt ca omitem din analiza asocierea dintre Yoga si alimentatia sanatoasa, aceasta din urma fiind cauza probabila pentru imbunatatirea starii de sanatate in aceasta situatie vorbim tot despre existenta unei legaturi false intre X si Y, determinate de prezenta unei a treia variabile C, care joaca rolul unei variabile confundate Figura 3 3 Situatia unor corelatii false Teoretic, solutia metodologica pentru situatia corelatiilor false ar fi aceea de a varia nivelul variabilei independente si a urmari efectul acesteia asupra variabilei dependente, in contextul in care s-ar controla (tine constanta influenta) nivelul variabilei terte (confundate) Pe langa problematica corelatiilor false, in cadrul discutiei despre cea de-a treia variabila pot fi aduse in discutie relatiile de mediere, respectiv de moderare Pastrand in minte exemplul utilizarii exercitiilor Yoga pentru a reduce frecventa racelilor, este posibil de luat in calcul un alt scenariu interpretativ De exemplu, este posibil ca intre practicarea Yoga si regimul alimentar sanatos sa nu existe doar o relatie simpla de asociere (o parte insemnata dintre practicantii Yoga mananca sanatos si se confunda efectele determinate de acestea asupra unei variabile terte), ci sa existe o relatie cauzala in sine (studii experimentale bine controlate, in care se constata ca practicantii Yoga, spre deosebire de voluntarii aflati pe lisa de asteptare pentru a incepe o formare in Yoga, mananca mai sanatos) in acest caz, lantul cauzal devine urmatorul: practicarea Yoga contribuie la imbunatatirea regimului alimentar al practicantilor, iar un regim alimentar corespunzator diminueaza problemele de sanatate intr-un asemenea scenariu, desi se poate spune ca exercitiile Yoga constituie o cauza indirecta a reducerii frecventei racelilor, explicatia pentru acest lucru nu vizeaza exercitiile fizice in sine, ci un efect al filosofiei Yoga, regimul alimentar sanatos Gradul de validitate al unui asemenea rezultat ipotetic este apreciat diferit Din punctul de vedere al unui studiu care urmareste un obiectiv cauzal-descriptiv, legatura dintre practicarea Yoga si ameliorarea starii de sanatate ar fi o inferenta valida, pentru ca in acest caz nu conteaza si validarea explicatiei pentru relatia cauzala constatata, ci numai validarea existentei relatiei cauzale in schimb, din perspectiva unui studiu care urmareste un obiectiv cauzal-explicativ, inferenta ar fi valida doar in contextul mentionarii intregului lant cauzal si a existentei unui sprijin empiric pentru aceasta prin datele colectate in aceasta situatie, suntem interesati atat de validitatea inferentelor cu privire la relatia cauzala in sine, cat si de validitatea inferentelor cu privire la explicatia gasita pentru relatia cauzala respectiva Figura 3 4 Cazul unei relatii de mediere (stanga), respectiv al relatiei de moderare (dreapta) in sfarsit, o relatie cauzala poate fi inteleasa gresit si in situatia in care cea de-a treia variabila joaca un rol moderator extrem Prin variabila moderatoare se intelege acea variabila care afecteaza intensitatea relatiei dintre doua variabile in cazuri extreme se poate ajunge la situatia ciudata de a se inversa chiar efectul observat De exemplu, impactul pe care muzica clasica il are asupra relaxarii psihice este moderat de nivelul de educatie sau de modelul cultural adoptat Pentru persoane cu studii superioare, cu un nivel ridicat de cultura generala este foarte probabil ca muzica clasica sa faciliteze relaxarea in schimb, pentru persoane cu un nivel de scolarizare scazut, proveniti dintr-un mediu cultural in care se prefera ascultarea de manele, exista probabilitatea ca muzica clasica nu numai sa nu functioneze in a induce relaxare, ci chiar sa conduca la un efect invers, de crestere a nivelului de excitare (iritare, incordare) Daca studiul s-ar derula pe participanti eterogeni, apartinand ambelor culturi, s-ar putea ca relatia cauzala sa treaca neobservata, cele doua directii anulandu-se reciproc in consecinta, este posibil ca ignorarea unei variabile terte cu rol moderator sa conduca la concluzii distorsionate cu privire la relatia cauzala dintre variabilele asupra carora se produce efectul de moderare Problematica variabilelor confundate este esentiala din perspectiva gradului de validitate al inferentelor de tip cauzal Tabelul 3 6 contine cele mai relevante riscuri care au drept cauza impactul variabilelor confundate asupra VD (Shadish et al , 2002; Cook si Campbell, 1979) Tabelul 3 6 Riscuri privitoare la validitatea interna istoricul Exemplificare: intr-un studiu experimental sunt comparate doua grupe de elevi de gimnaziu, distribuiti aleatoriu, fie in grupa experimentala care urmeaza un program de consiliere de tip peer to peer (consiliere colegiala), fie in grupa de control (lista de asteptare) Scopul studiului este de a stabili eficienta consilierii colegiale in prevenirea fumatului Pe durata derularii experimentului, scoala din care fac parte elevii din studiu este selectata intr-un program national educativ despre consecintele negative ale consumului de alcool si tutun La finalul derularii interventiei nu sunt identificate diferente semnificative statistic intre cele doua grupe Acest tip de risc se refera la orice tip de eveniment neplanificat care afecteaza evolutia variabilei dependente, astfel incat nu se poate aprecia cu certitudine daca efectul observat este datorat interventiei dorite (consilierii colegiale) sau evenimentului (istoricului) neplanificat (programul educational cu rol informativ) Pentru a evita asemenea situatii, se recomanda includerea in formularul de consimtire a unei solicitari exprese ca, in cazul in care accepta sa participe in studiu, sa nu urmeze alte tratamente alternative Aspectele de istoric insa pot privi orice situatie aparuta pe durata implementarii interventiei, inclusiv: (a) situatii cu impact emotional major asupra individului cuprins in studiu (cum ar fi situatiile de deces in familie sau aflarea faptului ca sufera de o boala grava, cand interventia este menita sa reduca depresia); (b) evenimente promovate intens in mass-media (rata scazuta de promovabilitate la bacalaureat in mijlocul unui studiu adresat elevilor de liceu, care isi propune sa testeze eficienta unei noi metode de invatare) etc in sfarsit, desi cand ne referim la istoric, avem in vedere un impact generalizat asupra tuturor participantilor la studiu, pot fi analizate si situatii individuale, pentru a decide daca individul poate fi pastrat ca subiect in studiu (de exemplu, se imbolnaveste si nu poate participa decat la 30% dintre sedintele planificate) Solutii uzuale: Utilizarea unui grup de control (evenimentele cu caracter public vor afecta la fel de mult grupul experimental si pe cel de control) si debriefing sau interviuri individuale efectuate la final, dupa caz (pentru a detecta situatii incadrabile ca istoric, la nivel individual) Maturarea Exemplificare: intr-un studiu cvasiexperimental de tip pretest-posttest fara grup de control au fost urmariti 20 de indivizi ce sufereau de oboseala cronica Acestia au fost testati cu privire la nivelul lor de oboseala atat inainte, cat si dupa derularea unui program de antrenare a gandirii pozitive, derulat pe o perioada de sase saptamani La finalul interventiei se observa o scadere semnificativa statistic a nivelului de oboseala Acest tip de risc se refera la faptul ca unele dintre evenimentele studiate se pot ameliora de la sine Astfel, multe tulburari se pot remite spontan De asemenea, in anumite situatii, deficientele se corecteaza de la sine odata cu maturizarea sistemului nervos central (vezi diminuarea simptomatologiei asociate enurezisului sau deficitului de atentie etc , odata cu inaintarea in varsta) La fel de adevarat este faptul ca, in cazul situatiilor cu o evolutie ciclica (sezoniera), se poate ajunge si la reversul situatiei, acelea de a subestima efectul interventiei Prin urmare, problema cu acest tip de risc este faptul ca nu vom putea sti cu certitudine daca modificarile sunt cauzate de interventia urmarita sau sunt o consecinta a maturarii Pentru a elimina aceasta risc este imperios sa se utilizeze un grup de control care sa nu beneficieze de interventie Acest tip de risc apare frecvent in studiile de psihologia dezvoltarii, indeosebi la copiii de varste mici, unde inclusiv cei din grupul de control au multe achizitii psihice intr-un interval scurt de timp Solutii uzuale: Utilizarea unui grup de control echivalent ca varsta sau alte caracteristici relevante pentru maturare (prin aceasta solutie, maturarea va afecta la fel de mult grupul experimental si pe cel de control, fiind controlat astfel impactul maturarii asupra VD) Testarea Exemplificare: in cazul in care participantii la studiu sunt supusi unor testari repetate (de exemplu, sunt rugati sa completeze aceeasi scala de inteligenta generala de trei ori intr-un interval de doua luni, in cadrul unui program menit sa augmenteze iQ-ul unui individ): exista riscul unei distorsiuni prin faptul ca, devenind familiari cu proba respectiva au sanse sa obtina un punctaj mai bun pe masura ce repeta testul (prin invatarea sau reamintirea unor raspunsuri) in acest tip de risc nu se modifica instrumentul, ci raportarea si modul de raspuns al individului la instrumentul de evaluare utilizat repetat Riscul este activ pentru probe subiective (evaluari prin autoraportare sau heteroraportare), fiind cu atat mai probabila cu cat exista un numar mai mare de repetari, intr-un interval mai scurt de timp intre sedintele de evaluare Solutii uzuale: Utilizarea ca VD a unor masuratori obiective sau extinderea distantei dintre sedintele de evaluare Acolo unde exista posibilitatea, pot fi utilizate probe paralele instrumentarea Exemplificare: Participantii la studiu longitudinal, intins pe o perioada lunga de timp (de exemplu, 15 ani, cu evaluari de la 4 la 19 ani) sunt examinati prin trei scale de inteligenta diferite (una specifica copiilor prescolari , una specifica elevilor de gimnaziu si una destinata evaluarii adolescentilor) Scopul studiului este de a evidentia daca un program menit sa augmenteze iQ-ul unui individ este eficient Rezultatele obtinute la finalul celor 15 ani de urmarire nu identifica diferente semnificative statistic intre grupul experimental si cel de control Prin acest tip de risc (specific mai degraba studiilor longitudinale derulate pe o perioada mai lunga de timp) ne referim, in principal, la modificari in instrumentele utilizate (de exemplu, proba de masurare a iQ-ului la 4 ani nu e potrivita pentru a fi utilizata pe subiecti de 19 ani, deoarece ar fi prea usoara, prin urmare nediscriminativa) Tot in aceasta categorie intra si situatia utilizarii unor versiuni diferite ale aceluiasi test De exemplu, este posibil ca un test sa fie revizuit si actualizat in timp din ratiuni psihometrice sau de modificare a continutului conceptului pe care il vizeaza Astfel, versiunea aplicata initial (la inceputul studiului) poate fi diferita de cea revizuita, aplicata la finalul studiului Pentru a evita asemenea situatii, ar trebui ca instrumentele diferite utilizate sa fie testate din perspectiva invariantei lor metrice Un alt caz de instrumentare apare in cazul utilizarii unor metode apreciative (subiective) de cotare, cum ar fi cazul observatiei De exemplu, poate interveni oboseala care afecteaza corectitudinea inregistrarilor sau pot fi implicati asistenti de cercetare diferiti de la un moment la altul al testarii, fiecare cu un stil personal de apreciere a evolutiei participantilor in mod similar, poate interveni o diminuare a exigentei in aprecierea subiectiva a comportamentelor, in directia asteptata prin ipoteze, indeosebi in contextul studiilor transparente, unde nu este posibila mascarea tipului de interventie primita Solutii uzuale: Stabilirea nivelului de invarianta dintre instrumente (in cazul probelor standardizate revizuite); apelul la probe standardizate si sau obiective; mascarea interventiei prin designuri de tip simplu-orb sau dublu-orb (asistentii de cercetare sa cunoasca din ce conditie experimentala face parte individual evaluat) etc Regresia catre medie Exemplificare: intr-un studiu efectuat in cadrul unui liceu cu multiple probleme de disciplina, psihologul scolar aplica un test de masurare a nivelului de agresivitate, in baza caruia selecteaza 20 de baieti - cei care inregistrau cel mai ridicat nivel de agresivitate Cu acordul acestora aplica un program de consiliere bazat pe tehnici comportamentale in scopul reducerii agresivitatii acestora Rezultatul statistic obtinut indica eficienta programului, nivelul de agresivitate masurat postinterventie fiind semnificativ statistic mai scazut decat la momentul pretestului Acest tip de risc este unul subtil pentru cei mai putin familiarizati cu principiile statisticii Regresia catre medie se refera la probabilitatea scazuta ca la o a doua testare sa se obtina tot scoruri extreme Astfel, cei cu scoruri foarte mari, vor avea sanse mari sa obtina scoruri ceva mai scazute, iar cei cu scoruri foarte mici, vor avea sanse mari sa obtina scoruri ceva mai ridicate decat la pretest Din punctul de vedere al practicianului, acest efect poate fi o mana cereasca Astfel, este foarte probabil ca un pacient sa apeleze la psihoterapie cand nivelul sau de distres este unul maxim sau ca o companie sa apeleze la serviciile unui consultant atunci cand problema "arde" Chiar daca propunerile practicianului nu sunt unele eficiente, este posibil sa se observe o diminuare (e drept nu foarte mare) a intensitatii problemei respective, ceea ce poate induce impresia gresita ca solutiile oferite au ajutat la reducerea gravitatii problemei Solutii uzuale: in cazul studiilor experimentale ar fi de dorit sa se selecteze un numar suficient de mare de persoane cu scoruri extreme (daca populatia evaluata este suficient de mare), astfel incat participantii selectati sa fie distribuiti randomizat fie in grupul experimental, fie in cel de control Aceasta masura ar conduce la egalizarea efectului regresiei catre medie in cele doua grupe, controland astfel impactul acestui posibil risc in cazul studiilor cvasiexperimentale fara grup de control, solutia ar fi ca participantii selectati in studiu sa faca parte in numar egal din ambele extreme (cu agresivitate foarte ridicata, respectiv cu agresivitate foarte scazuta) Distorsiunea in selectarea participantilor Exemplificare: intr-un studiu cvasiexperimental, un consilier familial doreste sa testeze eficienta tehnicii de respiratie Lamaze in reducerea durerilor din timpul travaliului nasterii naturale in urma sprijinului logistic primit din partea unei clinici de obstetrica si ginecologie, consilierul organizeaza o intalnire informativa pentru viitoarele mame la care participa 50 de persoane in urma intalnirii respective recruteaza 23 de persoane care s-au aratat interesate si incantate de metoda si au fost de acord sa participe la un numar de 10 sedinte destinate deprinderii tehnicii Lamaze Celelalte 27 de persoane care nu au dorit, din diferite motive, sa invete tehnica respectiva au fost de acord sa participe la studiu ca grup de control Problema cu acest tip de risc este ca cele doua grupuri pot fi diferite inca de la inceput in acest caz, participantele din grupul experimental au un nivel diferit de motivare si interes fata de metoda evaluata comparativ cu grupul de control, iar rezultatul favorabil tehnicii ar putea fi cauzat de acest plus motivational si nu de caracteristicile tehnicii in sine Sau este posibil ca in grupul experimental sa fi fost incluse mai multe viitoare mame cu sensibilitate mare la durere (speriate de gandul nasterii naturale), fapt care ar impieta gasirea unor efecte in favoarea eficientei tehnicii Lamaze, pentru simplul fapt ca exista diferente intre cele doua grupe in ceea ce priveste sensibilitatea fata de durere Riscul apare in orice context in care distribuirea participantilor in conditia experimentala alocata nu se face in mod aleatoriu De exemplu, testarea eficientei unei metode noi de predare comparativ cu cea clasica, in doua clase paralele, a V-a A - primind metoda noua, iar а V-a В - primind metoda clasica, nu poate fi facuta adecvat Eventualele diferente sesizate la final pot fi explicate atat prin plusul adus de metoda noua, cat si prin diferentele naturale existente intre cele doua clase inca inainte de a derula studiului (cum ar fi cazul in care sunt mai multi elevi buni in clasa a V-a A decat in clasa a V-a B) Solutii uzuale: Apelul la studii experimentale, care prin definitie presupun alocarea randomizata a participantilor in grupele experimentale (pentru detalii despre implementarea corecta a randomizarii, vezi sectiunea 4 1 3) Retragerea diferentiata a participantilor Exemplificare: Un director de programe educationale este interesat sa observe care dintre cele doua discipline facultative disponibile conduce la un grad mai mare de multumire fata de optiunea avuta Astfel, 100 de participanti la studiu au acceptat sa fie distribuiti randomizat, fie intr-un curs de astronomie (N = 50), fie intr-un curs de astrologie (N = 50) La finalul cursului, studentii au fost chestionati cu privire la atitudinea lor fata de cursul urmat (cat de mult le-a placut) Au raspuns la chestionarul aplicat la posttest un numar de 25 de studenti care au urmat pana la final cursul de astronomie si un numar de 45 de studenti care au urmat cursul de astrologie Restul studentilor ramasi nechestionati nu au fost evaluati pentru ca au renuntat sa finalizeze cursul respectiv, din diferite motive Nu au fost identificate diferente semnificative statistic intre cele doua cursuri, ambele parand a fi la fel de atractive Problema ilustrata in exemplul de mai sus este aceea ca la final comparatia s-a facut numai pe 50% dintre cei care au urmat astronomie si pe 90% dintre cei care au fost alocati cursului de astrologie Este foarte posibil ca absenta diferentei in atractivitatea celor doua cursuri sa fie cauzata de faptul ca la final au fost testati doar cei care considerat utile informatiile predate Este foarte posibil ca cei 50% dintre cursanti care au renuntat sa finalizeze cursul de astronomie sa fi facut acest lucru pentru ca nu au fost atrasi de disciplina respectiva Daca ar fi ramas in studiu pana la evaluarea finala, este probabil ca balanta s-ar fi inclinat catre o mai mare atractivitate pentru cursul de astrologie De aceea, compararea performantei inregistrate la nivel de postinterventie intre doua grupe cu un nivel diferit de pierdere a participantilor, semnifica a compara doua grupe care nu mai sunt echivalente, in pofida randomizarii initiale Pe langa pierderea diferentiata a participantilor (in limba engleza sunt utilizati doi termeni: attrition sau participant mortality), o problema, dar nu la fel de grava, o reprezinta pierderea participantilor in sine (nu se stie daca interventia ar mai fi fost eficienta daca am fi pastrat toti indivizii inclusi initial in studiu, inclusiv pe aceia care nu s-au regasit nu au perceput utilitatea interventiei primite) in domeniul psihoterapiei, un procent de 15-20% de participanti care renunta sa finalizeze intreg programul convenit poate fi considerat acceptabil, fiind necesar sa se tina seama de acest lucru atunci cand se stabileste marimea esantionului utilizat in studiu (fiind inclusi cu 15-20% mai multi participanti decat ar fi necesar) Solutii uzuale: Utilizarea, acolo unde este posibil acest lucru, a unui grup de control care sa primeasca o interventie dovedita a fi eficienta in locul unui lot de control de tipul absentei interventiei sau a listei de asteptare Tabelul 3 7 Riscuri privitoare la validitatea interna in functie de designul utilizat Rezultat obtinut S Long Studii cvasiexperimentale Studii experimentale Tip de risc p 0,05 (1) (2) (3) (4) (5) (6) (7) * istoricul X X + + - - - - - Maturarea* X + + - - - - - * Testarea X X + + — — — — — instrumentarea X X + + - ? - Regresia catre medie X -? - - - Selectia distorsionata X X - - + - - Pierderea (diferita) X X + + + + + Legenda: p 0,05 studiul conclude ca interventia nu este eficienta * Problema in cazul acestor tipuri de riscuri este dependenta de durata existenta intre pretest si posttest in cazul istoricului si al maturarii, riscul creste pe masura ce se scurge mai mult timp intre testari in cazul testarii, directia este una opusa, riscul creste pe masura ce timpul dintre testari este mai scurt (1) - studiu non-experimental longitudinal; (2) - studiu cvasiexperimental cu pretest posttest, fara grup de control; (3) - studiu cvasiexperimental cu pretest posttest si grup de control pasiv (nu primeste nimic); (4) - studiu cvasiexperimental, designul liniei intrerupte de regresie; (5) - studiu randomizat (experimental) pretest posttest, cu grup de control pasiv; (6) - studiu randomizat pretest posttest, cu grup de control activ (interventie uzuala, interventie alternativa); (7) - studiu randomizat pretest posttest, cu grup de control activ, cu mascarea interventiei primite; X - riscul respectiv, o posibila explicatie pentru rezultatul obtinut; + risc important; ? risc posibil, in functie de context; - risc absent sau improbabil Tabelul 3 7 poate fi citit in doua modalitati diferite, prin raportare la coloane (rezultatul obtinut, respectiv tipul de studii) sau prin raportare la linii (tipul de risc) De exemplu, daca luam in considerare rezultatul studiului, iar acesta indica ineficienta interventiei (nu exista diferente semnificative statistic), putem fi siguri ca maturarea sau regresia catre medie nu constituie riscuri pentru acest rezultat Prin definitie, acest tip de riscuri conduce la erori de tip i (concluzii ca interventia este eficienta, desi nu este adevarat acest lucru, diferentele semnificative fiind explicate ca urmare a maturarii sau a regresiei catre medie, acolo unde este cazul) in schimb, daca rezultatul obtinut indica faptul ca interventia este una eficienta, observam ca toate tipurile de risc discutate pot interveni activ in mod similar, daca luam in considerare tipul de design avut in vedere, de exemplu, studiul 3 din tabelul 3 7, reprezentand un design cvasiexperimental cu pretest si posttest si cu un grup de control care nu primeste niciun fel de interventie, vom putea desprinde urmatoarele informatii legate de riscurile existente Studiul prezinta riscuri majore indeosebi cu referire la: (a) distorsiunea in selectie (in absenta randomizarii fiind posibil ca cele doua grupe comparate sa difere de la nivelul pretestului, cu privire la nivelul VD sau a altor factori cu impact asupra evolutiei VD); (b) pierderea diferentiata a participantilor, ca urmare a: 1 numarului mai mare de participantii alocati grupului de control retrasi comparativ cu cei din grupul experimental, primii fiind nemultumiti ca nu primesc o interventie pentru problema lor; 2 numarului mai mare de participanti alocati in grupul experimental retrasi comparativ cu cei din grupul de control, ca urmare a unei interventii ce necesita un efort prelungit sau care are o multitudine de efecte secundare negative Aspecte precum istoricul, maturarea, testarea, instrumentarea si regresia catre medie sunt considerate riscuri improbabile pentru acest tip de design, nu pentru ca nu ar fi posibila aparitia lor, ci pentru ca de cele mai multe ori, atunci cand ele apar, tind sa afecteze la fel de mult ambele grupe din studiu, atat pe cel experimental, cat si pe cel de control Prin egalizarea efectelor lor (mentinerea constanta a influentei lor) am putea urmari in continuare daca diferenta existenta intre grupul experimental (cel care primeste interventia) si grupul de control (cel care nu primeste interventia) este una semnificativa statistic in sfarsit, in cazul unui design de tip cvasiexperimental precum studiul 3, care prin definitie sufera de distorsiunea in selectia participantilor, oricand este posibil sa apara interactiuni intre acest risc si celelalte (vezi nota 1 de la pagina 100) Tot din analiza pe linii (tipuri de risc) pot fi desprinse o serie de concluzii generale cum ar fi: (a) introducerea unui grup de control reduce foarte mult riscurile de tipul istoricului, maturarii, testarii, instrumentarii sau regresiei catre medie prin mentinerea constanta a influentei acestor factori de risc atat in grupul experimental, cat si in cel de control; (b) apelul la distribuirea aleatorie a indivizilor in conditiile experimentale elimina distorsiunea de selectie, ca posibil risc (cel putin teoretic, in conditiile asigurarii unui numar suficient de mare de subiecti inclusi in fiecare conditie experimentala) Astfel, daca luam studiul 6 (probabil cel mai bun design posibil in domeniul psihologiei - un studiu randomizat controlat cu un grup experimental ce beneficiaza de o interventie inovativa, respectiv un grup de control activ, caruia i se ofera interventia standard), vom constata ca majoritatea riscurilor privitoare la validitatea interna sunt absente sau improbabile Raman mai crescute riscurile pentru pierderea diferentiata a participantilor (in cazul in care cele doua forme de interventie nu sunt la fel de atractive pentru subiecti sau difera semnificativ in ceea ce priveste cantitatea de efort si de resurse, inclusiv de timp, implicate) in incheierea discutiei despre riscurile privitoare la validitatea interna a unui studiu merita subliniat faptul ca toate aspectele mentionate anterior vizeaza punctul (c) din perspectiva conditiilor necesare pentru a demonstra o relatie cauzala: masurile menite sa reduca probabilitatea ca efectul observat sa fie cauzat de variabile confundate si nu de interventia urmarita La aceste riscuri se adauga cel cu privire la ambiguitatea stabilirii cu claritate a relatiei temporale Astfel, in studiile corelationale transversale (in care toate masuratorile sunt colectate in acelasi timp) este imposibil de decelat daca modificarile in variabila-cauza preceda modificarile la nivelul efectelor observate sau daca situatia este una inversa De aceea, numai studiile in care modificarile la nivelul presupusei variabile preceda masurarea efectelor pot fi utile in a adresa intrebari de tip cauzal in aceasta categorie intra studiile experimentale cvasiexperimentale in care manipularea Vi are loc inainte de a masura impactul la nivelul VD la momentul postinterventiei Tot aici putem include studiile non-experimentale longitudinale (care presupun mai multe valuri de colectare a datelor - cel putin trei), situatie in care putem observa daca modificari in presupusa variabila cauza de la momentul TO la Ti preceda temporal si covariaza cu modificarile temporale observate in efectul urmarit de la momentul Ti la T2 3 4 3 Validitatea de construct Constructele sunt esentiale pentru functionarea oricarei stiinte prin cele trei roluri majore pe care le indeplinesc (Shadish et al , 200): (a) de a oferi o semnificatie si a facilita interpretarea rezultatelor unui studiu si integrarea acestora la nivel de teorii; (b) prin implicatiile sociale, politice sau economice pe care le au, soldate deseori cu modificari terminologice, cum este cazul conceptelor cu potential de stigmatizare (termenul "handicapat" fiind inlocuit cu "persoana cu nevoi speciale" etc ); (c) de a facilita la avansarea cunoasterii (sintagme precum "genomul uman", "memorie procedurala" etc erau necunoscute acum 100 de ani) Caseta 3 2 Exemplificarea utilitatii folosirii constructelor (o adaptare dupa Elmes, Kantowitz si Roediger iii, 2012) O serie de studii, atat experimentale, cat si corelationale, din domeniul psihologiei transporturilor au evidentiat mai multe rezultate disparate: (a) soferii au nevoie de un timp mai mare de reactie pentru a citi corect turometrul (turatia motorului lor) pe masura ce trebuie sa vireze mai mult de volan (curbe mai abrupte), traficul este mai dens (sunt mai multe masini in trafic), iar distanta fata de un vehicul periculos este mai mica (in fata masinii se afla un tir imens, cu incarcatura periculoasa); (b) nu numai timpul necesar citirii turometrului este afectat de cei trei factori mentionati, se observa si o scadere in viteza de manevrare a volanului (steering wheel rate); (c) mai mult, asemenea solicitari au efecte la nivel neurofiziologic, fiind observata o asociere intre variabilitatea ritmului cardiac (scade variabilitatea) si situatiile de conducere descrise, cum ar fi conducerea masinii in trafic dens sau in apropierea unor vehicule mari, ce induc un sentiment de nesiguranta, respectiv in abordarea unor curbe periculoase Daca ar fi sa schitam logic relatia dintre toate aceste variabile specificate am obtine o situatie precum cea reprezentata in partea de sus a figurii 3 5 Pentru a face ordine in aceasta retea de legaturi si pentru a simplifica interpretarea tuturor acestor relatii, cercetatorii pot propune noi constructe care sa ajute la o mai buna intelegere (descriere) a situatiei analizate si care sa ne permita sa facem predictii cu privire la evolutia lucrurilor in exemplul prezentat, un astfel de concept ar putea fi cel de nivel de solicitare (workload), care tine seama de raportul dintre cerintele mediului extern si efectele asupra performantei individului (partea de jos a figurii 3 5) Daca nivelul de solicitare creste, se poate ajunge la suprasolicitare, cu consecinte negative asupra sigurantei in trafic in plus, studii ulterioare pot extinde nivelul de generalizare (aplicabilitate) a unui asemenea construct la alte situatii decat cele din trafic Acest tip de logica constituie baza oricarui demers din psihologie, inca de la inceputurile sale ca stiinta (vezi teoriile motivationale bazate pe impulsuri si nevoi pentru a explica diferite comportamente umane) Acest lucru se intampla pentru ca in psihologie se opereaza frecvent cu concepte abstracte (cum ar fi credintele irationale, stima de sine, angajamentul organizational etc ) pentru a oferi un sens si a ajuta la o mai buna intelegere a diferitelor paternuri ale comportamentului uman Spre deosebire insa de inceputurile psihologiei, in prezent se acorda o mai mare importanta cerintei ca aceste noi constructe formulate in psihologie si teoriile arondate acestora sa fie conectate la rezultatele din alte stiinte (de exemplu, sa fie sprijinite la un nivel implementational [biologic] de analiza) Bunaoara, teoria szondiana a genelor pulsiunilor si a destinului nu este perceputa ca fiind intemeiata pe constructe solide, deoarece prevederile ei sunt lipsite de o fundamentare biologica Figura 3 5 Simplificarea intelegerii si interpretarii realitatii prin introducerea de constructe Asadar constructele psihologice sunt concepte abstracte inferate din comportamentele observate, pornind de la anumite modele teoretice de functionare a proceselor psihice considerate acceptabile la un moment dat (Kerlinger si Lee, 2000) De exemplu, concepte precum inteligenta generala, anxietatea, atribuirea sau nivelul de solicitare nu pot fi vazute, auzite sau atinse in realitate Cu toate acestea, rolul lor este asemenea factorilor din analiza factoriala: de a extrage aspecte comune din diferite comportamente si a oferi o interpretare pentru patternul observat (daca un individ vorbeste urat cu altii, tranteste usi, isi loveste animalul de companie etc , spunem despre persoana respectiva ca este agresiva) Data fiind importanta constructelor pentru orice demers de cercetare, dar si din cauza naturii lor abstracte, bazate pe interpretarea realitatii observate in baza unor modele ipotetice si de explicare a mintii umane, adresarea aspectelor legate de validitatea de construct este sensibila, dar esentiala pentru a interpreta corect rezultatele unui studiu Pentru a intelege mai bine distinctia dintre validitatea statistica, validitatea interna si validitatea de construct, vom lua in considerare un posibil articol cu titlul: "Un studiu randomizat privind eficienta psihoterapiei interpersonale la adolescentii depresivi" Validitatea statistica vizeaza masura in care rezultatul statistic obtinut este unul corect (sunt evitate erorile de tip i sau ii) Validitatea interna vizeaza masura in care legatura observata poate fi privita in termeni cauzali (interventia respectiva este cauza pentru modificarile observate la nivelul depresiei) Validitatea de construct vizeaza masura in care cercetatorul a operationalizat corect studiul respectiv in exemplul de mai sus, ar viza intrebari concrete precum: "suntem siguri ca interventia oferita este corect denumita psihoterapie interpersonala?"; "suntem siguri ca masuratorile variabilei dependente constituie masuratori adecvate ale nivelului de depresie?"; "suntem siguri ca participantii la studiu sunt nominalizati corect ca fiind adolescenti depresivi?" Pelham si Blanton (2007) au sintetizat memorabil aceste caracteristici ale validitatii de construct spunand ca are in vedere masura in care cercetatorul a reusit sa faca (operationalizeze) ceea ce si-a propus sa faca, a spus ca a facut si ar fi trebuit sa faca (how well was done what the researcher meant, said, or should have done) in plus fata de aceste intrebari, tipice pentru orice tip de studiu empiric, in cazul studiilor care isi propun un scop cauzal-explicativ (posibil numai prin studii randomizate), validitatea de construct poate contribui la un obiectiv suplimentar, acela de a gasi explicatii pentru relatia cauzala (de exemplu, "din ce motiv functioneaza psihoterapia interpersonala in combaterea depresiei?"; "care este explicatia valida pentru acest rezultat?") O alta fraza memorabila cu referire la validitatea de construct este oferita de Trochim (2006), parafrazand celebra afirmatie din justitie: "jur sa spun adevarul, intregul adevar si numai adevarul" Conform acestui autor, problema validitatii de construct se refera la masura in care instrumentul utilizat reflecta "constructul, intregul construct si numai constructul vizat" insa, validitatea de construct nu se refera doar la corectitudinea masuratorilor efectuate (de exemplu, masurarea depresiei), asa cum s-ar crede, ci vizeaza gradul de adecvare in modul de operationalizare si implementare a intregului studiu, referindu-ne aici la participanti, la contextul cercetarii si la variabilele masurate in studiu, fie ca este vorba de modul in care a fost implementata interventia (manipularea Vi) sau de efectele observate (VD) Aceasta viziune reprezinta o extindere facuta de Shadish et al (2002), pornind de la modul initial de a conceptualiza validitatea de construct (Campbell si Stanley, 1963; Cook si Campbell, 1979) care se rezuma doar la nivelul de adecvare legat de operationalizarea variabilelor din studiu (manipularea experimentala, respectiv operationalizarea variabilei dependente sau a altor covariabile masurate) Totusi, desi au trecut mai bine de zece ani de la aceasta extindere a sferei validitatii de construct, numai trei dintre cele patru surse care pot viza validitatea de construct au cunoscut o dezvoltare continua Este vorba, in primul rand, de pastrarea in prim-plan a preocuparilor pentru modul in care s-a conceput si efectuat masurarea variabilelor incluse in studiu (de exemplu, Vi si VD in studiile experimentale), respectiv de discutia cu privire la validitatea de construct din perspectiva participantilor inclusi in studiu Luand in calcul aceasta directie de dezvoltare, ne vom axa in cele ce urmeaza numai asupra acestor trei ipostaze importante din perspectiva validitatii de construct Nu in ultimul rand, o precizare importanta pentru studiile experimentale, evidentiata de Susser, Schwartz, Morabia si Bromet (2006), este aceea ca atat validitatea interna, cat si cea de construct vizeaza, in esenta, identificarea variabilelor confundate Totusi, in cazul validitatii interne problema se pune in a identifica acele riscuri (variabile confundate) care ar fi condus la rezultate semnificative statistic in absenta interventiei (actiunii Vi), fiind extrinseci interventiei (modului de manipulare а Vi) Astfel, nu se poate distinge clar daca interventia sau variabila confundata sunt cauza efectului observat in schimb, in cazul validitatii de construct problema este identificarea acelor riscuri care au efect asupra variabilei dependente, dar care fac parte din interventie, fiind intrinseci interventiei (modului de manipulare а Vi) in aceasta situatie nu se poate distinge clar sursa (explicatia) relatiei cauzale obtinute 3 4 3 1 Validitate de construct cu implicatii la nivelul participantilor din studiu Fie studiul non-experimental comparativ ce urmareste daca exista diferente intre femeile cu rezidenta in mediul rural si cele cu rezidenta in mediul urban in ceea ce priveste frecventa utilizarii prezervativelor Problema cu acest tip de studiu, unde nu intervine niciun fel de manipulare experimentala (deci nu ridica probleme de validitate interna), este legata de dificultatile in operationalizarea participantilor Astfel, daca nu sunt luate masuri de control, este foarte posibil ca cele doua loturi sa difere si cu privire la alte caracteristici studiate decat cea mentionata De exemplu, este foarte posibil sa existe o proportie mai mare de femei cu studii superioare in lotul persoanelor din mediu urban decat al celor din mediul rural De asemenea, s-ar putea sa existe diferente intre cele doua loturi cu privire la modul in care se raporteaza comportamental la religie si la preceptele religioase etc De aceea, in lipsa unor masuri elementare de control al participantilor inclusi in studiu, am putea afirma la fel de bine ca studiul urmareste diferentele existente cu privire la utilizarea prezervativelor intre femei cu studii superioare, care adera la practicile religioase, si cele fara studii superioare, care nu adera la practici religioase De asemenea, chiar daca controlam atent potentiale variabile confundate, definitorii pentru participant, ar trebui acordata mai multa atentie si definirii a ceea ce inseamna persoana cu rezidenta in mediul rural, respectiv urban De exemplu, poate ca un procent de 25% dintre femeile incluse in lotul cu rezidenta in mediul urban au mai putin de un an vechime de cand s-au mutat de la sat la oras Sunt in acest caz ele potrivite (reprezentative) pentru a fi incluse in grupul celor cu rezidenta in mediu urban? Pentru a evita asemenea situatii, cea mai buna solutie ar fi aceea de a oferi definitii operationale pentru ceea ce se intelege prin femei cu rezidenta in mediul urban, respectiv in mediul rural Problema validitatii de construct cu privire la participantii inclusi in studiu este adresata de obicei in studiile randomizate controlate, precizandu-se foarte clar ce fel de participanti au fost eligibili pentru a fi inclusi in studiu si care sunt criteriile de excludere De exemplu, in studiul efectuat de David et al (2008), care viza efectului terapiei cognitiv-comportamentale asupra adultilor cu depresie majora, se stipuleaza explicit ca au fost incluse doar persoanele care: (a) au fost diagnosticate cu depresie majora dupa standardele DSM-iV; (b) au obtinut scoruri mai mari sau egale cu 20 la scala de depresie Beck; (c) au obtinut un rezultat de cel putin 14 sau mai ridicat la scala de depresie Hamilton; (d) si nu prezinta alte comorbiditati psihiatrice dupa DSM-iV De asemenea, au fost exclusi din studiu cei care urmau deja un tratament medicamentos sau psihoterapeutic, precum si cei cu varsta sub 18 ani sau cei de peste 70 de ani Prin aceste precizari explicite se poate aprecia mult mai bine masura in care modul de operationalizare asociat participantilor corespunde constructului teoretic de adulti suferinzi de depresie majora 3 4 3 2 Validitate de construct cu implicatii la nivelul interventiei (manipularii Vi) in mod firesc, obtinerea unui rezultat semnificativ statistic in cadrul unui studiu experimental constituie un temei puternic pentru ca orice cercetator sa considere ca interventia testata este una eficienta sau ca manipularea experimentala a produs efectul dorit Validitatea de construct localizata la nivelul Vi urmareste gradul de adevar (incredere) in explicatiile oferite cu privire la relatia cauzala demonstrata Ea nu pune in discutie valoarea de adevar cu privire la existenta unei relatii de tip cauza-efect (in studii experimentale) sau a unei relatii de asociere (in studii non-experimentale), ci urmareste masura in care explicatiile psihologice oferite pentru aceste relatii semnificative statistic au suport empiric De exemplu, in cazul interventiilor psihoterapeutice, Corday si Pion (2006) subliniaza faptul ca desi se demonstreaza faptul ca o interventie psihoterapeutica este eficienta (de exemplu, exista o relatie cauzala intre expunerea la forma respectiva de psihoterapie si ameliorarea simptomatologiei depresive), efectul poate fi determinat de alte componente asociate interventiei decat cele utilizate ca explicatie Astfel, eficienta unei interventii este dificil de explicat pentru ca efectul poate fi cauzat de: (a) unele variabile confundate nespecifice, intrinseci interventiei (cum ar fi expectantele cercetatorului, efectul placebo etc ); (2) alte explicatii plauzibile care nu au fost verificate (explicatii concurente); (3) unele cauze necunoscute in situatia implementarii problematice a interventiei (ceea ce s-a oferit clientilor difera semnificativ de ceea ce ar fi trebuit sa li se ofere - aderenta scazuta la prevederile manualului de interventie) De aceea, pentru a ne asigura ca interpretarea unei relatii cauzale este cea corecta, ar trebui sa ne asiguram ca cele trei surse mentionate au fost controlate nu constituie explicatii plauzibile pentru rezultatul obtinut De aceea, vom discuta in paginile urmatoare principalele tipuri de probleme (riscuri) la adresa validitatii de construct cu referire specifica la cazul Vi prezente in studii experimentale sau cvasiexperimentale Acestea sunt reflectate sintetic in figura 3 6 Complexitatea manipularii  complexitatea interventiei Reactivitatea participantilor la studiu Subreprezentarea constructului Amenintari iu adresa validitatii de construct in operationalizarea Vi Contaminarea Efectul tratamentului diferentiat Confuzia dintre construct si modalitatile sale Probleme cu livrarea integra a interventiei cu manipularea Vi Noutatea stimulilor  noutatea interventiei Asteptarile experimentatorului Figura 3 6 Schita principalelor probleme intampinate in adresarea validitatii de construct a variabilei independente 3 4 3 2 1 Complexitatea manipularii Vl complexitatea interventiei Printre cele mai subtile amenintari la validitatea de construct (a modului in care a fost operationalizata variabila independenta) se regaseste complexitatea constructului utilizat Kazdin (2010) descrie succint cazul general al farmacoterapiei, in care grupul experimental (cel care primeste medicamentul experimental) este comparat cu un grup de control (care nu primeste nimic), iar rezultatul indica diferente semnificative statistic in favoarea grupului experimental Un asemenea rezultat nu ridica probleme din perspectiva validitatii interne (presupunand ca privitoare la aceasta au fost evitate) Problema apare atunci cand cercetatorul isi propune sa explice rezultatul obtinut, cum ar fi ideea ca medicamentul respectiv este eficient in reducerea simptomatologiei depresive, spre exemplu Cele doua grupe nu difera numai la nivelul ingerarii posibilei substante active Simplu fapt ca cei din grupul experimental primesc un tratament poate conduce la asteptari pozitive din partea participantilor inclusi in grupul experimental Aceste asteptari, cunoscute generic sub numele de efectul placebo, pot aparea chiar daca medicamentul primit nu contine nicio substanta activa Efectul apare pentru ca pacientii cred ca medicamentul primit ii va face bine, le va ameliora problemele de sanatate Rezultatul este uimitor! Studiile arata faptul ca, desi medicamentele antidepresive ajuta la ameliorarea simptomatologiei recuperare doar in aproximativ 50% din cazuri, un efect pozitiv se obtine si in contextul in care se administreaza placebo, pentru aproximativ 1 din 3 indivizi aflati, fara stiinta lor, in acest grup (Agentia de Cercetare si Politici de Sanatate Publica din SUA, 1999 apud Kazdin, 2010) in cazul interventiilor psihologice, conceptualizarea ideii de placebo se concretizeaza adesea prin urmarirea unor factori nespecifici, cum ar fi oferirea unor sedinte de consiliere in care rolul consilierului este mai degraba unul pasiv, de a oferi informatii despre problema care necesita interventia si de a asculta problemele avute de individul consiliat Pana la urma, grupul experimental difera de cel de control, nu numai prin forma de interventie primita (de exemplu, coaching cognitiv-comportamental), ci prin insasi natura sarcinii De exemplu, cei din grupul experimental participa regulat la sedinte, spre deosebire de cei din grupul de control de tip "absenta interventiei" si primesc mai multa atentie din partea echipei de cercetare Participarea la asemenea sedinte activeaza in mod diferit resursele psihologice ale indivizilor din grupul experimental fata de cei din grupul de control, primii avand o incredere mai mare ca activitatile efectuate ar putea fi in beneficiul lor decat cei din grupul de control Pentru a ne asigura ca interventia respectiva si nu efectul placebo este responsabil pentru rezultatul obtinut, ar fi dezirabil ca grupul de control sa nu fie unul pasiv, ci sa urmeze o interventie nespecifica pentru problema respectiva in sfarsit, chiar daca efectul observat nu este cauzat de efectul placebo, ramane sa se stabileasca ce anume din cadrul psihoterapiei a condus la efectul observat Sa fie adevarata explicatia oferita de cercetator (de exemplu, reducerea cognitiilor irationale autodepreciative reduce nivelul depresiei)? Sau ameliorarea este consecinta altor factori psihoterapeutici precum increderea ridicata in expertiza terapeutului, consolidarea aliantei terapeutice, modificari ale altor tipuri de cognitii irationale decat cele autodepreciative etc ? Pentru a ne asigura de validitatea explicatiei oferite este necesar apelul la studii care se focalizeaza pe identificarea unor mecanisme cauzale (vezi sectiunea 4 2 3), indeosebi la studii care manipuleaza experimental gradientul (cantitatea de exercitii) menit sa conduca la relatia cauzala observata Aceeasi problema a complexitatii Vi din perspectiva modului in care a avut loc manipularea experimentala apare si in alte tipuri de studii experimentale din psihologie, in afara celor care vizeaza testarea unor interventii cu impact aplicativ in domenii diverse (clinic, educational, organizational etc ) De exemplu, caseta 3 3 contine descrierea unei asemenea situatii in domeniul cercetarii fundamentale din psihologia sociala Asadar, o consecinta frecvent intalnita in situatiile care sufera de problema complexitatii constructelor este capacitatea redusa de a oferi explicatii valide pentru rezultatele obtinute Acestea raman la stadiul unor discutii speculative, al unor directii viitoare de cercetare Caseta 3 3 ilustrarea dificultatilor de explicare a rezultatelor provenite din studii experimentale (cu validitate interna demonstrata; exemplul 2 - adaptare dupa Brewer, 2000) Exemplul ipotetic 1 Ritmurile hip hop induc agresivitatea Este posibil ca, in cadrul unui studiu experimental, participantii sa fie supusi intr-una din cele doua conditii experimentale diferite: (a) sa asculte albumele de muzica hip hop ale formatiilor Parazitii si BUG Mafia; (b) sa asculte slagare muzicale din anii '80 din repertoriul Angelei Similea, respectiv al Corinei Chiriac Variabila dependenta este reprezentata de o masura implicita a agresivitatii masurata prin timpul de reactie necesar completarii unor anagrame (de exemplu, lonag rearanjat devine golan, lasand la o parte discutia cu privire la adecvarea acestei operationalizari a variabilei dependente din perspectiva validitatii de construct) Rezultatul studiului (fara probleme privind validitatea interna) sprijina existenta unei relatii cauzale, nivelul de agresivitate fiind mai ridicat in grupul celor care asculta hip hop Explicatia oferita de cercetator pentru acest rezultat vizeaza ca mecanism explicativ starea de spirit diferita transmisa de cele doua genuri muzicale O asemenea explicatie este insa una pur speculativa, nefiind sustinuta prin alte masuri active in cadrul studiului Acest lucru se intampla pentru ca exista o alta interpretare plauzibila, aceea ca diferenta la nivel de agresivitate dintre cele doua genuri muzicale este dictata de limbajul diferit (de texte), nu de ritmul pieselor Atat timp cat cele doua genuri muzicale difera, atat la nivel de ritm, cat si de "cumintenie a textelor" niciuna dintre cele doua interpretari nu depaseste un nivel speculativ, astfel ca inferentele explicative oferite nu au validitate de construct Desigur, un asemenea experiment ar putea fi imbunatatit printr-o simpla manipulare experimentala in locul audierii unor formatii romanesti (cu texte inteligibile pentru participantii la studiu) se poate decide sa se asculte aceleasi genuri muzicale in interpretarea unor formatii japoneze in acest caz, diferentele la nivel de text dispar, astfel ca pastrarea unor diferente semnificative la nivelul agresivitatii nu ar mai putea fi explicate prin nivelul diferit de agresivitate prezent in continutul textelor insa problema interpretarii ar fi rezolvata doar partial, daca alti cercetatori ar deschide o noua linie de dezbare, exprimandu-si opinia ca agresivitatea semnalata si in muzica hip hop japoneza este transmisa nu prin ritmul melodic, ci prin diferente in tonalitatea vocii interpretului (mesajul paraverbal transmis) Exemplul 2 (vezi Brewer, 2000; Wikipedia, 2012) Disonanta cognitiva creste nivelul de atractivitate in studiul clasic realizat de Aronson si Mills (1959) li se cere participantilor la un experiment sa discute despre psihologia sexului Pentru a verifica daca sunt pregatiti sa vorbeasca despre un asemenea subiect, participantii au fost impartiti aleatoriu in trei grupe Unii dintre participanti au fost pusi initial sa citeasca cu voce tare in fata celorlalti cuvinte cu conotatie sexuala redusa (de exemplu, prostituata, virgina etc ) si anumite pasaje de text cu acelasi nivel moderat de conotatii sexuale Participantii din al doilea grup au avut aceeasi sarcina de facut, doar ca de aceasta data cuvintele si pasajele citite aveau o conotatie sexuala puternica (de exemplu, penis, vagin etc ) Subiectii inclusi in cel de-al treilea grup, cel de control, nu au nicio sarcina de initiere in grup Apoi toate grupurile au participat la o discutie voit plictisitoare (directie indusa de catre experimentator), cu tema: activitatea sexuala la animale La finalul discutiei de grup li s-a cerut tuturor sa aprecieze cat de mult le-a placut grupul ad-hoc creat si discutia avuta Rezultatele obtinute au aratat ca cei care au trecut prin conditia experimentala cea mai dura (stanjeniti de pronuntarea cu voce tare a unor cuvinte obscene in fata unor necunoscuti) au apreciat cel mai mult grupul de discutii la care au participat interpretarea autorilor pentru acest rezultat s-a facut din perspectiva disonantei cognitive Astfel, plusul de apreciere in evaluarea grupului din care au facut parte cei din conditia experimentala cu conotatii sexuale puternice a fost pus pe seama efortului suplimentar depus de ei pentru a depasi starea de disconfort (jena) Este posibil ca unul dintre gandurile pentru asi rezolva disonanta legata de supliciul prin care au trecut sa fi fost: "Pana la urma a meritat situatia jenanta in care m-am aflat, pentru ca grupul este chiar dragut" Din nefericire pentru autori, aceasta explicatie a fost contestata de alti cercetatori, care au oferit o interpretare alternativa plauzibila Aceasta ar fi ca nivelul ridicat de apreciere a grupului de discutii din partea celor aflati in conditia experimentala cu conotatii sexuale puternice este un rezultat rezidual al excitarii sexuale Cu alte cuvinte, citirea pasajelor respective a condus la o crestere a excitarii sexuale, iar acest efect s-a reportat si in aprecierea calitatii grupului si a discutiei de grup Prima explicatie oferita de autori nu se distinge de explicatia alternativa din perspectiva suportului empiric, de aceea se poate afirma ca interpretarea oferita este una speculativa, lipsita de validitate de construct Studii ulterioare au incercat sa rezolve aceasta dilema (Gerard si Mathewson, 1966 apud Brewer, 2000) prin eliminarea conotatiilor sexuale din studiu, dar cu pastrarea unui context nefavorabil de initiere in discutia de grup Astfel, in locul citirii unor cuvinte cu conotatie sexuala, li s-au aplicat participantilor din conditia experimentala adversiva niste socuri electrice, ca un test de sensibilitate emotionala in locul discutiei ulterioare despre sexul la animale, discutia, derulata tot intr-o maniera monotona, a fost despre copiat si alte forme de frauda Rezultatele obtinute din acest studiu au replicat conceptual ideea din cercetarea anterioara Astfel, persoanele din conditia experimentala care au fost supuse celui mai intens nivel de soc electric au fost cele care au apreciat cel mai mult grupul si discutia de grup Observatie! Printr-un asemenea demers se replica la nivel conceptual rezultatele studiului anterior si se elimina varianta evaluarii pozitive a grupului ca un efect al reportarii excitarii sexuale Acest lucru nu inseamna automat ca prima explicatie este confirmata in acest caz, ca si in cel al stiintei in general, ipotezele nu se confirma, ci doar pot fi sprijinite pana la proba contrarie O astfel de proba contrarie pare fi cazul unui studiu efectuat recent pe porumbei (Singera si Zentall, 2011), in care s-a aratat ca porumbeii sunt mai incantati de recompense daca acestea sunt primite dupa situatii negative Un astfel de rezultat ar elimina explicatia bazata pe disonanta cognitiva (daca asumam ca porumbeii nu rationalizeaza si nu-si justifica efortul!) in schimb, o alta explicatie devine plauzibila pentru toate cele trei studii descrise Ea este bazata pe discrepanta (distanta) afectiva dintre starea initiala perceputa negativ si starea finala pozitiva in limbaj popular, bucuria pare a fi mai mare daca vine dupa o stare de agonie (vezi sintagma "de la agonie la extaz"), decat daca trecerea este de la o stare neutra sau usor pozitiva la una de bucurie Din acest punct de vedere, se poate spune ca aceasta explicatie are un nivel ridicat al validitatii de construct deoarece: (a) reuseste sa ofere o explicatie plauzibila pentru studiul efectuat pe porumbei si sa elimine totodata celelalte doua variante explicative vehiculate; (b) sa constituie explicatii plauzibile in demersul de interpretare a studiilor anterioare Atat studiul bazat pe aplicarea initiala de socuri electrice, cat si cel bazat pe expunerea initiala la un disconfort social pornesc de la o stare afectiva negativa, nu de la un punct de start neutru insa, din punct de vedere al consolidarii validitatii de construct, demersul de cercetare ar putea continua De exemplu, ar fi utila demonstrarea interpretarii intr-o maniera directa, cum ar fi cazul replicarii celor doua studii derulate pe oameni, insotita de o verificare a manipularii experimentale Spre exemplu, se poate demonstra ca intre conditiile experimentale exista diferente cu privire la intensitatea perceptiei negative a starii initiale, intreband participantii cat de bine se simt dupa sarcina de initiere (manipulare confirmata daca perceptia negativa este mai intensa in conditia experimentala severa) Aceasta dovada ar constitui veriga lipsa necesara pentru interpretarea bazata pe discrepanta afectiva dintre starea initiala si starea finala Explicatia si-ar schimba statutul dintr-una plauzibila, dar indirecta (rezultatele mai multor studii fiind interpretabile prin apelul la distanta afectiva), intr-o explicatie "dovedita", sprijinita empiric printr-o serie de replicari conceptuale, cu un nivel ridicat al validitatii de construct 3 4 3 2 2 Subreprezentarea constructului O problema frecvent intalnita cu privire la validitatea de construct este aceea a operationalizarii constructului teoretic printr-o singura variabila sau printr-un set limitat de stimuli Acest lucru duce la subreprezentarea constructului teoretic, problema cunoscuta in literatura de specialitate ca distorsiunea operationalizarii singulare (mono-operation bias) Unii cercetatori consacrati in domeniul validitatii unei cercetari o considera ca fiind cel mai serios risc privitor la validitatea de construct (Cook si Campbell, 1979) in sensul ei originar, aceasta distorsiune are in vedere situatia in care este utilizata o singura modalitate de reprezentare a unui construct, astfel incat nu se poate distinge daca efectul observat este cauzat de constructul pe care il reprezinta sau de aspectele particulare (specifice) ale stimulului (metodei respective) - vezi caseta 3 4 Ulterior, riscul si-a extins sfera de cuprindere, fiind vizate orice situatii in care constructul evaluat este operationalizat printr-un numar insuficient de stimuli sau de fatete ale constructului ori prin lipsa de reprezentativitate a acestora Caseta 3 4 ilustrarea subreprezentarii constructului (distorsiunii mono-operationale) Exemplu ipotetic impactul credibilitatii sursei asupra mesajelor cu rol persuasiv intr-un studiu experimental s-a vizat influenta credibilitatii sursei asupra acceptarii unui mesaj persuasiv luand cazul concret al Rosiei Montane si al beneficiilor economice rezultate in urma inceperii exploatarii zacamantului aurifer in cele doua grupe experimentale utilizate a fost transmis acelasi mesaj (pentru a controla impactul continutului acestuia), fiind insa manipulata sursa (personajul) care se presupune ca a formulat mesajul respectiv Primului grup experimental i s-a transmis ca este vorba despre o femeie casnica, in varsta de 45 de ani, mama a trei copii, care se ocupa in timpul liber de crosetat pentru a face un ban in plus Aceasta a lucrat o vreme la o intreprindere aflata la 20 de km distanta, dar apoi a renuntat, preferand sa se ocupe de treburile gospodaresti si de educatia copiilor, bazandu-se financiar doar pe ajutorul social de la stat si alocatia copiilor Celui de-al doilea grup i s-a specificat ca mesajul este transmis de un analist financiar, doctor in stiinte economice cu o tema privind rentabilitatea economica a sectorului minier, bursier Fullbright, avand numeroase publicatii de specialitate privind dezvoltarea economica a regiunilor miniere defavorizate, dar si o capacitate buna de a comunica mesaje accesibile publicului larg pe intelesul acestuia Cele doua situatii experimentale difera, asadar, prin nivelul diferit de expertiza a personajului despre care se afirma ca este sursa textului persuasiv prezentat Problema cu acest gen de studii este faptul ca scenariile prezentate reprezinta cazuri particulare singulare pentru constructele uzitate, fapt ce poate conduce la dificultati in explicarea clara a motivelor pentru care s-au inregistrat diferente intre grupe De exemplu, categoria generala a expertilor economici vizeaza o multitudine de exemplare diferite De aceea, este posibil ca diferentele observate sa fi fost altele daca in descrierea celui de-al doilea personaj, inlocuiam sintagma bursier Fullbright, cu aceea de angajat al Gabriel Gold Corporation (compania canadiana cu interese economice directe in exploatarea aurului din zona) De asemenea, daca studiul ar fi fost efectuat pe studenti de la Litere, iar in locul mamei ar fi fost prezentata o tanara absolventa de limbi straine, reintoarsa pe meleagurile natale, impactul ar fi putut fi altul Solutia necesara pentru a evita asemenea situatii este aceea a apelului la un set de cazuri diferite pentru a descrie cele doua categorii avute in vedere: fara expertiza economica, respectiv cu o asemenea expertiza Bunaoara, pentru prima conditie experimentala s-ar apela, in locul unei singure descrieri, la cinci personaje diferite (drept caracteristici demografice, stil de viata), dar care impartasesc acelasi atribut (lipsa expertizei in domeniul economic) Acelasi demers s-ar putea realiza pentru cel de-al doilea grup experimental, apelandu-se la cinci personaje diferite, toate cu expertiza in domeniul economic Fiecare participant in acest studiu modificat, ar fi in continuare expus unui singur personaj (sursa), selectat in mod aleatoriu dintre personajele dezvoltate pentru conditia experimentala de care apartine Daca rezultatele indica diferente intre cele doua grupe experimentale in directia asteptata, vom avea o mai mare de incredere in a afirma ca nivelul de expertiza al sursei influenteaza actul persuadarii dincolo de continutul mesajului transmis in absenta acestor exemplare multiple reprezentative pentru acelasi construct, diferentele dintre conditiile experimentale ar putea fi cauzate de alte aspecte specifice care diferentiaza cazurile unice comparate (primul personaj fiind o femeie casnica, cel de-al doilea un barbat activ in campul muncii etc ) O problema similara cu cea precizata in caseta 3 4 poate aparea in cazul studiilor randomizate controlate care testeaza eficienta unei interventii Kazdin (2010) surprinde corect aceasta problema De exemplu, fie cazul in care se urmareste compararea eficientei interventiei A cu cea a interventiei B, interventia A fiind implementata de doi terapeuti specialisti in interventia A, in timp ce interventia B este livrata de un singur specialist Rezultatul obtinut sprijina ipoteza ca interventia B este mai eficienta decat interventia A in diminuarea problemei semnalate Desi din perspectiva statistica si a validitatii interne, afirmatia poate fi valida, exista o explicatie alternativa pentru rezultatul obtinut Este posibil ca diferenta observata sa apara pentru ca terapeutul specialist in interventia B este un profesionist mai bun decat cei care au implementat interventia A Mai mult, chiar daca ambele tipuri de interventie ar fi implementate de acelasi psihoterapeut (care detine acreditari atat pentru interventia A, cat si pentru B), este posibil ca acesta sa se simta mai confortabil si mai eficient intr-o anumita forma de psihoterapie Din cauza acestor limite interpretative, se recomanda ca atunci cand se doreste compararea eficientei unor forme diferite de interventie sa se apeleze la un numar mai mare de persoane care sa implementeze fiecare conditie experimentala, pentru ca la final sa se analizeze masura in care compararea eficientei interventiilor este moderata de eventuale diferente surprinse in calitatea terapeutilor care au livrat interventiile respective 3 4 3 2 3 Confuzia dintre construct si modalitatile sale Sa ne imaginam ca este testata eficienta unui program de coaching executiv menit sa reduca fluctuatia de personal Durata intregului program este de 10 ore cumulate cu ocazia a cinci intalniri fata in fata intre consultant si manager Rezultatul obtinut nu sprijina ideea eficientei acestui program (diferentele dintre pretest si posttest fiind nesemnificative statistic) insa interpretarea corecta in acest caz ar fi una usor diferita Nu putem afirma ca programul de coaching in ansamblul sau este unul ineficient, ci ca programul de coaching in formatul scurt cu cinci sedinte (totalizand 10 ore de coaching) este unul ineficient Acest lucru este cu atat mai probabil cu cat un program de coaching mai lung, de exemplu, totalizand 50 de ore, sa aiba un nivel de eficienta demonstrat empiric Acest gen de probleme este frecvent intalnit in domeniul psihologiei experimentale, in care o importanta deosebita revine calibrarii stimulilor De exemplu, un efect de amorsare semantica (conceptual priming) poate fi constatat daca stimulul amorsa este prezentat timp de 200 ms inainte de aparitia stimulului-tinta, in timp ce efectul de amorsare este absent daca stimulul-amorsa este prezentat doar 150 de ms inainte de aparitia stimulului-tinta in acest context nu spunem despre efectul de amorsare ca nu functioneaza, ci ca efectul nu apare daca expunerea la stimulul-amorsa este mai mica de 200 de ms Un exemplu similar, dar mai facil de inteles vine din sfera medicinei Putem spune despre un anumit antibiotic ca este eficient in combaterea unei maladii doar daca discutam la un nivel generic in realitate, antibioticul respectiv este eficient in lupta cu maladia respectiva doar daca este luat in anumite doze prestabilite experimental 3 4 3 2 4 Probleme cu livrarea integra a interventiei acuratetea manipularii Vi intre ceea ce este planificat pe hartie si ceea ce se intampla in realitate pot exista uneori diferente importante ca urmare a devierii de la protocolul (manualul) interventiei, de la procedura standard stabilita Conform lui Carroll et al (2000), orice interventie oferita ar trebui descrisa in termeni de: (a) doza oferita - frecventa, numarul si durata sedintelor; (b) ingrediente active ale interventiei - specificul interventiei si premiza generala urmarita pentru a produce modificarile dorite; (c) conditii in care sunt administrate; (d) evaluarea masurii in care interventia a fost livrata adecvat De exemplu, in cazul ipotetic al unui studiu ce ar viza efectul terapiei rational-emotive in directia reducerii depresiei comparativ cu un grup de control de tipul listei de asteptare, o posibila descriere a interventiei oferita grupului experimental ar putea fi: Terapia rational-emotiva implementata in grupul experimental: (a) s-a derulat bisaptamanal, timp de 20 de sedinte cu durata de 1 ora; (b) in cadrul acestora s-au urmarit identificarea, disputarea si inlocuirea credintelor irationale ale participantilor cu altele rationale, indeosebi a celor care contin referiri autodepreciative (self-downing irrational beliefs), considerate a fi responsabile pentru aparitia mentinerea depresiei; (c) sedintele s-au derulat individual, prin intermediul a patru terapeuti certificati REBT, cu o experienta clinica medie de 5 ani de zile; (d) interventiile s-au derulat conform specificatiilor prezentate in manualul interventiei, aderenta la tratament fiind verificata prin sondaj cu ajutorul inregistrarilor audio existente Cu alte cuvinte putem spune despre o interventie ca are probleme cu livrarea integra (implementarea fidela) daca: (a) nu dispune de un manual de interventie care sa ofere recomandari standard cu privire la ceea ce este de facut in cadrul interventiei; (b) dispune de un asemenea manual, dar din verificarile efectuate se constata o aderenta scazuta a terapeutilor trainerilor la specificatiile din manual (fie din cauza unui nivel precar de pregatire al celor care implementeaza interventia, fie din cauze motivationale diverse, fie de la un stil de lucru orientat mai degraba spre nevoile clientului decat spre atingerea obiectivelor planificate) in sfarsit, o a treia cauza posibila pentru aparitia unei discrepante intre ceea ce se intentioneaza a se livra si ceea ce se intampla in realitate poate fi (c) un nivel scazut al compliantei clientilor la cerintele formulate de catre terapeuti traineri Din motivele invocate mai sus, se obisnuieste ca, in studiile randomizate controlate care urmaresc eficienta unei interventii, sa fie colectate date suplimentare cu privire la integritatea interventiei livrate, asa cum a fost ea planificata initial, cu referire specifica la punctele (b) si (c) mentionate in paragraful anterior Astfel, se vorbeste de aderenta terapeutilor la tratament daca, in urma examinarii unui esantion de sedinte din totalul sedintelor de terapie inregistrate, se constata o corespondenta intre ceea ce era specificat in manualul interventiei cu privire la sedinta respectiva si ceea ce s-a intamplat de fapt Corespondenta nu vizeaza aspecte de detaliu (replici etc ), ci vizeaza obiectivul sedintei si repertoriul de exercitii sarcini de efectuat in vederea atingerii obiectivului respectiv Tot prin intermediul unor aprecieri, mai degraba cu caracter subiectiv, obtinute prin intermediul unui expert neimplicat in studiu, se poate evalua competenta celor care livreaza interventia in sfarsit, se poate de asemenea evalua nivelul de complianta al participantilor la interventia primita (masura in care accepta serviciile primite si raspund pozitiv solicitarilor formulate de terapeuti - de exemplu, prin efectuarea temelor pentru acasa) Aspecte legate de integritatea livrarii (manipularii) variabilei independente apar si in alte contexte experimentale decat cele care vizeaza testarea eficientei unei interventii in acest context al discutiei pot fi evidentiate doua nuante ale integritatii cu referirea la adecvarea manipularii experimentale Pe de o parte, transpare ideea implementarii standardizate a manipularii Vi (absenta unor artefacte introduse de erori experimentale) Un astfel de exemplu este cel determinat de respectarea protocolului standardizat in activarea conditiilor experimentale si a altor aspecte procedurale implicate (de exemplu, daca studiul solicita ca subiectul sa fie pozitionat la 30 cm de un monitor cu diagonala de 17 inch, atunci ar trebui sa se respecte aceasta cerinta; daca studiul presupune un anumit instructaj standard, atunci acesta ar trebui livrat integral si celor care dau impresia ca au inteles repede sarcina pe care o au de efectuat etc ) Pe de alta parte, integritatea tratamentului in contexte experimentale, cum sunt cele de laborator, face referire directa la conceptul cunoscut sub denumirea de verificarea reusitei manipularii experimentale (manipulation check) - vezi caseta 3 5 pentru ilustrarea conceptului si importanta acestuia pentru validitatea de construct a studiului Caseta 3 5 Verificarea reusitei manipularii experimentale Exemplu ipotetic Dispozitia afectiva negativa scade performanta la probe de viteza mentala Pentru a verifica validitatea acestei afirmatii, s-a apelat la un experiment in care participantii au fost impartiti in trei conditii experimentale Astfel, in prima faza a experimentului unii au citit o istorioara amuzanta cu un final fericit pentru personajul principal al povestii, altii au citit o istorioara trista cu un final negativ de poveste, iar un al treilea grup a citit un text abstract, neutru din perspectiva mesajului si a deznodamantului oferit Aceasta manipulare experimentala a fost implementata pornind de la premisa ca celor din prima conditie experimentala povestirea amuzanta le va induce o stare de spirit optimista, pozitiva, celor din a doua conditie experimentala povestirea trista le va induce o dispozitie afectiva negativa, iar cei din cea de-a treia conditie experimentala vor avea o dispozitie afectiva neutra in a doua faza a experimentului, toti participantii la studiu, indiferent de conditia lor experimentala au completat un test de viteza perceptiva, luandu-se in calcul performanta lor ca numar de elemente parcurse corect intr-un interval de 5 minute Rezultatele statistice au aratat ca exista diferente intre cele trei grupe, cei din conditia experimentala 2 (povestire cu final trist) avand cel mai scazut nivel al performantei la sarcina de viteza Pentru a ne putea asigura ca inferenta de la baza acestui studiu este una corecta (ca manipularea experimentala este adecvata) este necesar sa aratam mai intai ca exista diferente intre cele trei grupe comparate cu privire la nivelul dispozitiei lor afective, nu doar sa presupunem acest lucru De exemplu, subiectii ar putea raspunde dupa finalizarea istorioarei la un set scurt de itemi care sa reflecte starea lor de moment (cat de bine sau cat de tristi se simt in momentul respectiv?), iar apoi sa completeze proba de viteza Vom considera ca manipularea experimentala a reusit daca intre cele trei grupe se constata diferente semnificative cu privire la dispozitia lor afectiva din momentul respectiv, in directia anticipata inca din momentul planificarii studiului (de exemplu, ca dispozitia afectiva negativa are cel mai inalt nivel in conditia experimentala in care s-a lecturat povestea cu un final trist, diferenta fata de celelalte doua grupe fiind una semnificativa statistic) Desi poate parea redundant, un asemenea demers constituie o masura necesara pentru a ne asigura ca ceea ce s-a intentionat (obtinerea unor variatii in dispozitia afectiva a participantilor in functie de conditia lor experimentala) s-a petrecut in realitate Pot exista situatii cand manipularea experimentala esueaza, din diverse motive precum: (a) variatii prea mici in intensitatea stimulilor (de exemplu, desi alcoolul scade timpul mediu de reactie, se poate ca acest lucru sa nu fie observat daca se compara doua loturi care consuma cantitati reduse de alcool (100 ml de bere vs 200 ml de bere); (b) caracterul artificial (nivelul redus de realism al conditiei experimentale), fapt ce ii poate determina pe participanti sa raspunda diferit de comportamentul lor natural in sfarsit, verificarea manipularii experimentale poate juca un rol important in eliminarea unor explicatii alternative De exemplu, in cazul descris mai sus o alta explicatie posibila pentru scaderea vitezei de perceptie are legatura mai degraba cu alterarea perceptiei timpului (perioada de timp petrecuta pentru lecturarea povestirii triste pare a fi mai lunga), iar acest efect poate fi reportat in proba de viteza, participantii avand impresia ca au mai mult timp la dispozitie pentru completarea ei, fapt pentru care adopta un ritm ceva mai putin alert de lucru Pentru a elimina o asemenea explicatie alternativa, la finalul povestirii participantii pot fi rugati atat sa estimeze timpul care a trecut de la momentul inceperii lecturarii povestirii, cat si sa se autoevalueze cu privire la dispozitia lor afectiva curenta Daca nu se constata diferente semnificative intre grupe cu privire la durata timpului estimat, dar apar diferente intre grupe in directia asteptata cu privire la starea lor afectiva, putem spune ca explicatia bazata pe diferente in dispozitia afectiva este valida Din acest punct de vedere, verificarea reusitei manipularii experimentale poate oferi explicatii utile, verificabile ulterior prin studii ce vizeaza identificarea mecanismelor schimbarii responsabile pentru aparitia unei relatii de tip cauza-efect in urma introducerii verificarii reusitei manipularii experimentale si a masurarii existentei unei relatii dintre Vi si VD rezulta patru situatii posibile (Kazdin, 2010): (a) efectele apar atat la nivelul manipularii experimentale, cat si la nivelul variabilei dependente; (b) manipularea experimentala pare a fi reusit (exista diferente intre grupe), dar nu exista diferente la nivelul VD; (c) manipularea experimentala pare a nu fi reusit (nu exista diferente intre grupe), dar acestea apar la nivelul VD; (d) nici cu ocazia verificarii reusitei manipularii experimentale, nici la nivelul diferentelor dintre grupe cu privire la VD, nu se obtin rezultate semnificative statistic interpretarea semnificatiilor posibile pentru aceste rezultate este reflectata in tabelul de mai jos Tabelul 3 8 interpretarea rezultatelor ca urmare a dinamicii dintre efectul la nivelul VD si reusita (nereusita) manipularii experimentale Cazul A Cazul B Manipularea Vi reusita (p 0,05) 0,05), efect VD prezent (p 0,05), efect VD prezent (p 0,05), efect VD absent (p > 0,05) Nu este clar daca Vi are efect asupra VD Manipularea a fost prea slaba pentru a produce efecte, prin urmare (i) Diferentele obtinute la nivelul ipoteza studiului nu a fost realmente testata Sunt necesare modificari VD sunt intamplatoare (eroare de in modul de manipulare а Vi tip i) sau sunt cauzate de un alt factor decat Vi (ii) Verificarea reusitei manipularii experimentale s-a facut gresit (probleme psihometrice) Exemplu (ii): s-a reflectat un alt construct decat Vi; s-au formulat ambiguu neclar itemii din procedura de verificare a reusitei manipularii, fapt care a afectat fidelitatea acesteia 3 4 3 2 5 Reactivitatea participantilor la studiu Participantii la studiile psihologice, cu atat mai mult la cele derulate in conditii de laborator, au tendinta de a reactiona diferit de felul lor natural de a fi, atunci cand stiu ca sunt supusi unei evaluari psihologice (vezi caseta 3 6) Acest lucru constituie un risc privitor la validitatea de construct deoarece ar fi dificil de precizat daca explicatia pentru efectul obtinut se regaseste in caracteristicile interventiei sau este doar o consecinta a reactivitatii participantilor Caseta 3 6 ilustrarea reactivitatii participantilor ca risc privitor la validitatea de construct Reactivitatea participantilor Exemplificare: intr-un studiu cvasiexperimental se urmareste daca un material persuasiv despre un personaj politic modifica atitudinea potentialilor alegatori fata de acesta Astfel, atat inainte, cat si dupa prezentarea unui film documentar de 20 de minute, participantii sunt rugati sa evalueze gradul de simpatie pe care il au fata de personajul respectiv, pe o scala de la 1 [extrem de antipatic] la 9 [extrem de simpatic] Continutul filmului documentar era unul negativ la adresa acestuia Rezultatul obtinut sprijina ideea eficientei unor astfel de materiale, nivelul de simpatie pentru personajul evaluat fiind mai redus la posttest decat la pretest Prin reactivitatea participantilor se intelege, la nivel general, ideea ca participantii dintr-o cercetare sunt constienti de acest rol, fapt pentru care se pot comporta diferit fata de felul lor natural sau pot decide sa ofere raspunsuri consistente cu ipotezele implicite pe care cred ca le testeaza studiul De exemplu, in cazul descris, este foarte probabil ca multi dintre participanti sa intuiasca ce se urmareste prin studiul respectiv, cum ar fi "in ce masura pot fi ei influentati de materiale cu rol propagandistic?" in baza acestei intuitii cu privire la scopul studiului, ei pot decide sa ofere raspunsuri care sa-l multumeasca pe experimentator, in directia reducerii nivelului de simpatie pentru personaj Altii pot adopta pozitii opuse, de rezistenta fata de materialul persuasiv Aceasta situatie este cunoscuta in literatura de specialitate sub denumirea de caracteristicile sarcinii (demand characteristics) (Orne, 1962 apud Kazdin, 2010) Cel mai adesea, consecinta acestui efect este de a sprijini ipoteza intuita, fiind mai multi participanti complianti (sau preocupati sa lase o impresie buna), decat participanti rezistenti (care "nu se lasa pacaliti manipulati" de catre experimentator) Solutii uzuale: Chestionarea participantilor la finalul experimentului (debriefing) cu privire la ce cred ca s-a urmarit prin studiu (care erau ipotezele vizate) si analiza statistica a rezultatelor separat la cei care au intuit, respectiv nu au intuit corect despre ce a fost vorba in studiu Reactivitatea este prezenta daca eficienta interventiei (manipularii experimentale) apare numai la cei care au intuit ce se urmarea prin studiul respectiv este mai intensa in cazul acestora 3 4 3 2 6 Noutatea interventiei Acest tip de risc reprezinta un tip particular de reactivitate a participantilor Orice interventie noua, o inovatie intr-un domeniu, poate contribui la cresterea entuziasmului, a energiei si asteptarilor cu privire la utilitatea unei asemenea interventii (pe principiul ca daca este un produs sau serviciu de ultima ora ar fi mai bun decat altele existente pe piata de ceva timp) in cazul unor rezultate semnificative statistic este greu de stabilit daca acest fapt se datoreaza eficientei interventiei in sine sau este o consecinta a perceptiei pozitive (a etichetelor de tip "nou", "revolutionar", "de ultima generatie") Un tip aparte de efect, ca rezultat al combinatiei dintre noutate si reactivitatea participantilor este efectul Hawthorne (Roethlisberger si Dickson, 1939 apud Shadish et al , 2002) Acesta se refera la situatiile in care apar modificari semnificative intre momentul dinainte si cel de dupa introducerea unei interventii, dar acest lucru nu este generat de eficienta interventiei, ci de situatia experimentala in sine (participantii sunt constienti de statutul lor social special ca subiecti in cercetare, se bucura de o atentie speciala si sunt beneficiarii unor interventii "noi", diferite de activitatile de uzura in care au fost implicati pana atunci) Pentru a diferentia daca efectul observat este datorat interventiei in sine sau elementului de noutate, se poate urmari daca interventia isi pastreaza aceeasi magnitudine a marimii efectului (un nivel similar de eficienta), pe masura trecerii timpului 3 4 3 2 7 Contaminarea Prin contaminare se are in vedere situatia cand o parte sau intreaga interventie destinata grupului experimental devine cunoscuta si grupului de control De exemplu, un program de consiliere menit sa imbunatateasca comunicarea asertiva este implementat intr-o clasa de elevi (a iX-a A), in timp ce elevii din clasa a iX-a B sunt inclusi in studiu drept grup de control in pretest, cele doua clase au inregistrat niveluri similare in abilitatea de a comunica asertiv Totusi, dupa fiecare sedinta de consiliere, cativa elevi din clasa a iX-a A se intalnesc cu prietenii lor din clasa a iX-a B, carora le povestesc din secretele deprinse in orele de consiliere Acestia devin interesati de acest subiect si decid sa exerseze si ei sarcinile primite ca tema pentru acasa de catre cei din grupul experimental Ca urmare a acestui fapt, se obtine un rezultat nesemnificativ statistic, astfel ca eficienta programului de consiliere nu este sprijinita de datele empirice colectate Contaminarea, desi este inclusa clasic in randul riscurilor privitoare la validitatea de construct, poate fi perceputa ca un pericol pentru validitatea interna, deoarece creste probabilitatea aparitiei unei erori de tip ii (sa nu fie identificate diferente semnificative statistic, cand ar fi trebuit sa apara, dar acestea au fost estompate prin faptul ca si cei din grupul de control au beneficiat partial sau in intregime de facilitatile oferite celor din grupul experimental) Astfel, in functie de gravitate (nivelul de extindere al contaminarii), consecinta poate consta in diminuarea intensitatii efectului produs de interventie (diminuarea marimii efectului) sau chiar in anularea efectului produs de interventie (diferente nesemnificative intre cele doua grupe) O solutie posibila in contextele cu risc crescut de aparitie a contaminarii (de exemplu, in cazul in care grupele comparate sunt constituite din doua clase scolare paralele din cadrul aceleiasi scoli) este aceea de a apela la studii experimentale cu randomizare la nivel de cluster 3 4 3 2 8 Efectul tratamentului diferentiat Acest efect se manifesta la participantii din grupul de control atunci cand: (a) acestia fac parte dintr-un grup de control pasiv de tipul absentei interventiei sau a listei de asteptare (detalii in sectiunea 4 1 4); (b) in cazul in care desi beneficiaza de o interventie activa, ca membri ai grupului de control, ei stiu ca serviciul pe care-l primesc nu este cel inovativ, experimental (potential mai bun decat celelalte forme de interventie existente la vremea respectiva) intr-un astfel de caz este foarte posibil ca rezultatele grupului de control, in consecinta intregul demers comparativ, sa fie afectate: (a) fie prin demoralizarea membrilor din grupul de control pentru faptul ca nu beneficiaza de facilitatile oferite celor din grupul experimental; (b) fie prin comportamente de compensare (pentru a nu ramane in urma fata de cei din grupul experimental) in plus, in cazul grupelor de control pasiv cercetatorii pot interveni oferindu-le beneficii compensatorii pentru neincluderea in conditia experimentala activa, pentru a-i motiva sa ramana participanti in studiu Aceasta atentie sporita si eventualele beneficii compensatorii oferite, s-ar putea sa produca un efect activ nespecific, cauzat de simpla atentie grija acordata participantilor din grupul de control Consecintele tratamentului diferential variaza in functie de predominanta efectului observat Astfel, daca in grupul de control apare mai frecvent demoralizarea membrilor, se mareste diferenta dintre conditiile experimentale (nu mai stim cu certitudine daca diferentele observate sunt cauzate de interventie, ca urmare a nivelului motivational scazut din grupul de control sau a diferentelor cu privire la expectanta succesului intre conditiile experimentale) in schimb, daca membrii din grupul de control adopta mai degraba comportamente compensatorii sau daca sunt beneficiarii unui surplus de atentie si sau masuri compensatorii, este posibil ca distanta dintre grupele experimentale sa se reduca Astfel ca, in situatia unui rezultat nesemnificativ statistic, nu vom cunoaste daca rezultatul este cauzat de ineficienta interventiei sau de tratamentul diferentiat cu rol compensator pe care il adopta sau de care se bucura participantii inclusi in grupul de control Cea mai eficienta si intalnita solutie pentru acest tip de risc este oferirea unor interventii nespecifice de tip placebo participantilor din grupul de control sau mascarea rezultatului distribuirii randomizate (designuri de tip orb) acolo unde acest lucru este posibil 3 4 3 2 9 Asteptarile experimentatorului Cele mai cunoscute efecte din aceasta categorie sunt efectele de autoindeplinire a profetiei, respectiv Pygmalion, care apar drept consecinte ale unor asteptari diferentiate (Rosenthal, 1966 apud Kazdin, 2010) in zona oricarei forme de interventie, ele se pot observa sub forma unor schimbari in tonul vocii, in postura, in expresia faciala, in tipul de intrebari formulate sau in modul de adresabilitate fata de client Daca acesta face parte din conditia experimentala activa (comparativ cu un grup de control pasiv) sau din conditia experimentala preferata de catre experimentator sau despre care acesta are impresia ca este mai eficienta decat alte forme de interventie (in comparatii cu un grup de control activ, perceput mai putin pozitiv), este posibil ca diferentele observate la finalul interventiei sa nu fie cauzate de diferente in eficienta acestora, ci de diferente in nivelul de asteptare, in modul de implicare, in modul de relationare cu clientii apartinand grupelor diferite Desigur, acest tip de efect poate constitui un risc doar in contextul in care diferenta observata apare in favoarea grupului preferat intre procedurile care pot fi implementate pentru a reduce riscul aparitiei acestui tip de amenintare se regasesc (Shadish et al , 2002): (a) utilizarea mascarii conditiei din care fac parte indivizii evaluati si sau a ipotezelor urmarite in studiu (de exemplu, prin implementarea unor designuri de tip orb pentru evaluatori si sau cei care implementeaza interventia); (b) reducerea la minimum a contactului dintre examinator si participantii la studiu Alte masuri care pot fi luate sunt: (c) utilizarea unui numar mai mare de asistenti de cercetare care implementeaza studiul, pentru a putea identifica un eventual caz in care efectul obtinut este moderat de stilul (asteptarile) asistentilor de cercetare terapeutilor trainerilor care au implementat studiul; (d) replicarea studiilor experimentale in contexte variate din perspectiva asteptarilor cercetatorilor (de exemplu, studiul se replica nu numai de catre echipa de cercetatori care propun interventia respectiva ca o noutate, ci si de catre o echipa concurenta, care poate testa eficienta interventiei respective fara a fi acuzata de conflicte de interese sau de un nivel diferit de asteptari si implicare in interventiile supuse testarii) 3 4 3 3 Validitate de construct la nivelul efectelor (variabilelor) masurate in psihologie, cel mai adesea se apeleaza la constructe abstracte (de exemplu, inteligenta emotionala) care trebuie operationalizate (masurate) in vederea colectarii unor date empirice si obtinerii unor rezultate Pe baza rezultatelor obtinute sunt discutate, mai apoi, implicatiile acestora din nou la un nivel abstract (conceptual, teoretic) De aceea, in linii mari si indiferent de forma de risc prezentata, atunci cand vorbim despre validitatea de construct la nivelul variabilelor masurate, inclusiv a celor de tipul VD, avem in vedere doua intrebari fundamentale: (a) "sunt instrumentul sau procedura utilizate potrivite pentru a descrie constructul?"; (b) "sunt justificabile inferentele explicative pe care le face cercetatorul de la rezultatele obtinute inapoi la teorie?" Prima intrebare se refera explicit la procesul prin care se trece de la constructul teoretic, prin operationalizare, la variabila masurata (indicatorul utilizat) - de la construct la variabila, de la general la particular Cea de-a doua intrebare se refera la demersul invers, acela de a reusi sa transforme rezultatele (variabilele analizate) in continuturi cu sens, relevante teoretic si conceptual - de la variabila la construct, de la particular spre general in sectiunea anterioara, dedicata prezentarii riscurilor in legatura cu Vi au fost abordate ambele aspecte, cu un accent pe cea de-a doua intrebare, deoarece prin natura lor, studiile experimentale (indeosebi cele cu un scop cauzal-explicativ) sunt centrate pe oferirea de explicatii referitoare la mecanismul cauzal implicat Ambele intrebari sunt importante si pentru validitatea de construct cu referire la alte variabile decat cele care implica manipulare experimentala (Vi) De aceea, o buna parte dintre riscurile discutate in sectiunea precedenta sunt valabile si pentru variabile-efect (VD) sau pentru variabile provenite din studii non-experimentale Tabelul 3 9 contine o descriere a celor mai relevante riscuri privitoare la aceste variabile Tabelul 3 9 Riscuri privitoare la validitatea de construct cu referire la variabilele-efect Riscuri privitoare la validitatea de construct a altor variabile decat Vi (provenite din studii non-experimentale; VD) Complexitatea constructului (construct confounding) Exemplificare: intr-un studiu comparativ non-experimental se constata diferente intre partidele parlamentare si cele neparlamentare privitoare la probabilitatea de a intra in parlament in mandatul urmator, in favoarea celor parlamentare Asumand ca inferenta este corecta din punctul de vedere al validitatii statistice, pot aparea probleme cu interpretarea (explicarea) rezultatului De exemplu, cercetatorul ar putea sa afirme ca partidul parlamentar are mai mari sanse sa intre din nou in parlament pentru ca pe durata mandatului in care este partid parlamentar are un acces mai mare la resurse, ceea ce poate insemna atragerea unor oameni mai valorosi capabili sa castige noi curse electorale insa o asemenea inferenta ar fi problematica din perspectiva validitatii de construct, pentru ca partidele parlamentare se deosebesc de cele neparlamentare si cu privire la alte aspecte cum ar fi: (a) un nivel de mediatizare diferit (timpul de antena mai ridicat pentru partidele parlamentare, inclusiv in campaniile electorale); (b) o mai buna retea teritoriala (structura organizatorica) pentru partidele cu reprezentanti in parlament; (c) absenta impresiei de vot irosit in cazul partidelor parlamentare (de exemplu, in cazul partidelor neparlamentare, desi unii candidati pot fi perceputi pozitiv, ei nu ajung sa fie votati pentru ca alegatorii nu ar dori sa-si iroseasca votul respectiv, in conditiile in care le lipseste increderea ca partidul respectiv va atinge pragul electoral solicitat) Subreprezentarea constructului (mono-operation bias) Exemplificare: intr-un studiu corelational ar fi discutabil sa se afirme ca exista o asociere semnificativa statistic intre nivelul de constiinciozitate si angajamentul organizational din perspectiva validitatii de construct, daca relatia se replica doar in cazul in care trasatura de personalitate vizata este masurata prin proba X, nefiind sustinuta daca constiinciozitatea este evaluata prin probele Y sau Z O problema similara apare atunci cand nivelul de constiinciozitate coreleaza cu performanta in munca doar in contextul in care criteriul este evaluat prin hetero-raportare, dar nu si atunci cand criteriul este masurat intr-un alt fel (de exemplu, apeland la un indicator obiectiv - criteriu hard) in sfarsit, daca ar fi sa ne raportam la un exemplu mentionat ceva mai devreme, transferat intr-un design non-experimental, privind compararea nivelului de agresivitate la cei care asculta muzica hip hop versus slagare, ar creste validitatea de construct daca se apeleaza la un numar variat de artisti si de piese muzicale din interiorul genului muzical evaluat decat daca ne-am baza doar pe cate 1-2 piese pentru fiecare din cele doua genuri de muzica Confuzia dintre construct si modalitatile sale (confounding constructs with levels of constructs) Exemplificare: in cazul in care se constata ca nivelul constiinciozitatii ca dimensiune globala de personalitate coreleaza semnificativ cu performanta in munca, se pot efectua analize ulterioare, la nivel de fatete, pentru a revela care dintre fatetele constiinciozitatii coreleaza cu performanta in munca (de exemplu, orientarea spre realizare) si care raman nesemnificative statistic (de exemplu, prudenta) Astfel, in cazul studiilor non-experimentale discutia cu privire la confuzia dintre construct si modalitatile sale vizeaza nevoia unei nuantari in interpretarea explicarea rezultatelor Distorsiunea metodei comune (mono-method bias) Exemplificare: intr-un studiu care urmareste sa identifice potentialul rol moderator al afectivitatii negative in relatia dintre constiinciozitate si comportamentele contraproductive ale angajatilor, toate cele trei variabile amintite, importante pentru scopul studiului, sunt masurate prin aceeasi metoda -completarea unor probe standardizate ce necesita autoraportare (self-reports) Daca toate variabilele sunt masurate prin acelasi tip de metoda (de exemplu, prin autoraportare), metoda devine parte din constructele masurate, crescand artificial intensitatea asocierii dintre variabile Aspectele comune pot viza oricare dintre caracteristicile instrumentelor utilizate (probele necesita acelasi tip de raspuns, pe scala Likert in 5 trepte; probele apeleaza la autoraportare; probele impartasesc acelasi stil de constructie a frazei, itemii fiind formulati in termeni pozitivi; probele sunt similare din perspectiva nivelului de dezirabilitate sociala implicat etc ) Problema apare ca urmare a faptului ca nu se poate distinge bine daca eventuala asociere dintre doua variabile este determinata de existenta unei legaturi reale intre variabile sau este doar un artefact al faptului ca ambele variabile impartasesc aceeasi metoda (acelasi fel de colectare a datelor) Aceasta problema este foarte cunoscuta in literatura de specialitate din domeniul psihologiei organizationale, dar mai putin cunoscuta in domeniul psihologiei clinice, fiind intalnita sub denumirea de varianta metodei comune (shared method variance sau common method bias) (P M Podsakoff, MacKenzie, Lee si N P Podsakoff, 2003) De altfel, intr-un studiu ulterior, acelasi grup de autori semnalau nivelul pandemic al acestui risc (76% dintre studii implica o singura metoda de colectare a datelor, iar 33% dintre studii se bazeaza exclusiv pe completarea de chestionare autoraportate) (Bodner, 2006 apud P M Podsakoff, MacKenzie si N P Podsakoff, 2012) impactul acestei distorsiuni este semnificativ la nivel de rezultate De exemplu, o metaanaliza a relatiei dintre factorii de personalitate si performanta in munca, ambele masurate prin autoraportare evidentiaza un efect mediu r = 0,26, in timp ce aceeasi relatie evaluata in contextul utilizarii unor metode diferite de colectare a datelor (personalitatea prin autoraportare, performanta in munca prin heteroraportare sau prin indicatori obiectivi) conduce la un efect r = 0,11 (Podsakoff et al , 2012) Dovezi insuficiente sau neconcludente cu privire la validitatea instrumentului utilizat Exemplificare: Majoritatea aspectelor legate de neajunsuri in calitatea psihometrica a unor instrumente (probleme de consistenta interna, restrictia de amplitudine etc ) au fost discutate in sectiunea referitoare la validitatea statistica insa pot fi intalnite cazuri in care nu se constata probleme cu privire la acuratetea si variabilitatea datelor colectate, ci cu privire la semnificatia acestora sau etichetarea lor in Romania, unul dintre exemplele tipice care imi vin in minte este cazul probei de mobilitate a atentiei Praga, extrem de intalnita in laboratoarele si cabinetele de psihologia transporturilor Acest test, desi are o consistenta interna si o validitate relativa la criteriu buna, masoara altceva decat cred cei mai multi ca masoara Astfel, foarte multi practicieni cunosc proba ca un instrument de masurare a atentiei distributive, confuzie la a carei origini se afla Bontila (1935) Acesta a etichetat-o ca o proba de atentie distributiva, fara a oferi sprijin stiintific pentru aceasta La perpetuarea acestei erori a contribuit din plin mediul academic romanesc, care a inclus proba in cursurile adresate studentilor, fara o analiza critica, in categoria testelor de atentie distributiva insa, daca vom analiza atent continutul probei, vom putea identifica imediat faptul ca nu exista elementele necesare unei sarcini de atentie distributiva Aceasta presupune prin definitie rezolvarea simultana a doua sarcini diferite (de exemplu, a numara cu voce tare in sens descrescator, de la 100 la 1, in timp ce se scrie un text nou dupa dictare) Situatii similare pot aparea la case mai mari De exemplu, in domeniul expansiv al cognitiilor sociale implicite (Gawronski si Payne, 2010; Sava, 2011) se vorbeste despre masuratori implicite ale stimei de sine Cu toate ca exista dovezi empirice in sprijinul unei asemenea etichetari, nu exista suficiente date pentru a ne asigura ca ceea ce se surprinde prin sarcinile respective este stima de sine implicita si nu concepte apropiate sau similare precum increderea de sine (self-confidence), autoeficacitatea (self-efficacy) sau aprecierea de sine (self-worth) Pentru a evita situatii ce decurg din definirea sau operationalizarea inadecvata a unui construct, Trochim (2006) recomanda parcurgerea a trei pasi: (a) definirea constructului prin raportarea la o retea semantica existenta de constructe (prin ce se aseamana si prin ce difera de alte constructe apropiate ca sens); (b) sa operationalizeze constructul tinand cont de aspectele acestuia definitorii (de exemplu, intr-o proba de atentie distributiva trebuie sa se solicite rezolvarea in acelasi timp a doua sarcini diferite, nu doar sa se chestioneze individul daca reuseste sa faca fata la mai multe sarcini derulate simultan - care ar fi doar o perceptie autoraportata a nivelului atentiei distributive, in cel mai bun caz, sau un item specific evaluarii nivelului de autoeficacitate, in cazul mai putin fericit); (c) sa existe dovezi empirice care sa confirme relatia dintre constructul evaluat si alte constructe sau acelasi construct masurat prin probe deja consacrate De obicei, acest punct c lipseste (sau este mai putin dezvoltat) in cazul unor probe nou-aparute De aceea, ar fi indicat ca cercetatorul fie sa apeleze la instrumente deja consacrate pentru evaluarea unui anumit construct, fie sa apeleze la instrumente mai putin cunoscute pentru care sa se ofere informatii suplimentare despre validitatea si fidelitatea probei, pentru a inlatura reticentele evaluatorilor cu privire la calitatile psihometrice ale instrumentului respectiv 3 4 4 Validitatea externa Brewer (2000) subliniaza ideea ca validitatea externa are in vedere ideea replicarii rezultatelor, a generalizarii rezultatelor obtinute intr-un studiu, pe alte persoane, contexte sau alte proceduri de cercetare (alte modalitati de manipulare ale Vi, alte VD, alte tipuri de design) Din acest punct de vedere, problematica validitatii externe vizeaza masura in care rezultatele pot fi replicate in contexte diferite ("avem de-a face cu rezultate robuste?", "ce factori moderatori au fost identificati?") si cu gradul de realism (transfer) al acestor rezultate in contexte naturale ("pot fi efectele transferate in contexte aplicative etc ?") З 4 4 1 Replicarea rezultatelor (robustetea rezultatelor) Spre exemplu, problema validitatii externe intr-un studiu al carui rezultat principal identifica o relatie semnificativa statistic intre expunerea la filme cu continut violent si nivelul de agresivitate vizeaza validitatea inferentelor cu privire la posibilitatea extinderii acestor rezultate: (a) la alte categorii de participanti (rezultatele sunt replicate nu numai pe lotul de copii de gimnaziu examinati, ci si pe alte categorii posibile: tineri, adulti, atat in cazul baietilor, cat si al fetelor etc ); (b) in alte contexte decat cel din cercetare (nu doar in studii de laborator, ci si in contexte naturale, cum ar fi vizionarea unui film violent intr-un cinematograf dintr-un mall); (c) la alte modalitati de operationalizare a variabilelor studiate (de exemplu, rezultatul este acelasi daca se apeleaza la un chestionar self-report de evaluare a agresivitatii de stare, cat si daca se utilizeaza o masura indirecta de evaluare a agresivitatii, cum ar fi lAT-ul [testul asocierilor implicite; Greenwald McGhee si Schwartz, 1998], sau o masura obiectiva, directa a agresivitatii precum observarea frecventei in care este pedepsit un personaj din cadrul unui joc pe calculator ce solicita administrarea de pedepse unui personaj, daca acesta nu atinge un anumit standard specificat etc ) in sfarsit, daca studiul este unul experimental, se urmareste si masura in care rezultatul este replicat in conditiile in care se variaza modul de manipulare a Vi (de exemplu, efectul apare in orice tip de material video catalogat drept unul violent, atat in cele care prezinta cazuri fictionale [filme SF], cat si in cele care prezinta situatii reale ["stirile de la ora 5"] etc ) Shadish et al (2002) limiteaza discutia despre validitatea externa doar la cazul studiilor experimentale sau cvasiexperimentale, aceasta fiind definita ca masura in care relatia cauzala transpare in situatia varierii persoanelor, contextelor, interventiei oferite si a modalitatii de masurare a efectelor (VD) Consider aceasta restrangere a sferei de actiune a discutarii aspectelor de validitate externa doar in legatura cu inferente referitoare la relatii de tip cauza-efect ca fiind una limitativa si mai putin inspirata Asa cum am amintit anterior, studiile nu vizeaza numai obiective de tip cauzal-descriptiv sau cauzal-explicativ De exemplu, ele pot urmari obiective descriptive propriu-zise ("care este incidenta anuala a depresiei majore la adolescenti?") sau descriptiv-analitice ("poate prezice constiinciozitatea performanta la locul de munca?") Desi niciunul dintre aceste studii nu urmareste obiective cauzale, ar fi important sa vedem in ce masura rezultatele lor sunt replicate in alte contexte si sau generalizabile la o intreaga populatie de interes Prin urmare este important sa analizam studiile prin prisma validitatii lor externe De exemplu, daca ar fi sa ne referim la faptul ca a fost obtinuta o asociere intre constiinciozitate si performanta in munca, am avea mai mare incredere in sansele de replicare a acestui rezultat intr-un context aplicativ, daca studiul a fost efectuat intr-un context natural, ecologic (cum ar fi in cadrul procesului de selectie), decat daca datele despre relatia dintre constiinciozitate si performanta in munca au fost colectate in cadrul unui studiu de laborator (context artificial), in care performanta a fost evaluata ca o masura de stare, prin nivelul atins intr-o sarcina de efectuat in cadrul studiului De aceea, pentru a analiza nivelul de reproductibilitate a rezultatelor obtinute intr-un studiu, un rol important il prezinta identificarea unor factori moderatori, cu alte cuvinte a efectelor de interactiune dintre rezultatul obtinut si diferiti parametri ai studiului (variatii cu privire la tipul de participanti, ale contextului cercetarii sau ale variabilelor implicate) Aceste interactiuni, reprezinta de altfel, principalele riscuri privitoare la validitatea externa, asa cum reiese din tabelul 3 10, cu precizarea ca le vom redefini terminologic fata de Shadish et al (2002), pentru a nu limita discutia doar la cazul studiilor ce vizeaza scopuri cauzale Tabelul 3 10 Riscuri privitoare la validitatea externa (adaptare dupa Shadish et al , 2002) Dependenta efectului de populatia studiata Este cunoscut faptul ca cele mai multe studii din domeniul psihologiei sunt efectuate pe studenti, datorita usurintei cu care acestia pot fi selectati ca participanti in studiu De exemplu, Sears (1986 apud Brewer, 2000) prezinta o statistica care indica ca nu mai putin de 74% dintre studiile de psihologie sociala publicate in reviste de prestigiu in anul 1985 au fost efectuate pe studenti din ciclul licenta Riscul generat de aceasta stare de fapt cu privire la validitatea externa este de a stabili in ce masura efectele obtinute in cadrul unei populatii specifice sunt replicate pe alte categorii de persoane Validitatea externa priveste nu numai statutul acestora (sunt replicate efectele pe adulti, copii, imigranti, persoane apartinand unor culturi diferite etc ), ci vizeaza si impactul pe care il are tipul de participanti selectati (voluntari, recompensati financiar, preselectati etc ) Pentru a inlatura (reduce) asemenea riscuri, se recomanda fie apelul la esantioane nationale reprezentative, fie utilizarea unor esantioane de convenienta selective (purposive sampling), care sa includa anumite categorii tintite de participanti Bunaoara, daca se asteapta ca genul persoanei sa modereze relatia dintre variabilele studiate, ar fi bine ca lotul utilizat sa includa participanti de ambele sexe si sa se testeze rolul moderator al genului asupra relatiei respective Dependenta efectului de contextul cercetarii Un efect obtinut poate fi dependent de un anumit context in care se deruleaza cercetarea De exemplu, eficienta pe termen lung a unui program de consiliere in vederea utilizarii prezervativelor pentru a reduce riscul de transmitere a bolilor venerice sau al aparitiei sarcinilor nedorite apare doar in studiile implementate in mediul urban, dar nu si la sate, pentru simplul motiv ca prezervativele se gasesc mai usor la oras decat la sate Un alt exemplu ar fi asocierea dintre doua variabile, precum observarea relatiei dintre constiinciozitate si comportamentele contraproductive doar intr-un context organizational in care liderul adopta un stil de conducere laissez faire (pentru ca un asemenea sef le ofera oportunitati celor mai putin constiinciosi sa devieze mai usor) Pentru a controla impactul pe care contextul il are asupra efectului studiat, se poate apela la studii cu un mare numar de participanti derulate in locatii multiple (large multisite studies) Dintre acestea, studiile randomizate controlate cu un numar mare de participanti, derulate in locatii multiple sunt destul de raspandite in domeniul sanatatii mentale, unde sunt extrem de apreciate Ele sunt considerate de unii specialisti, precum Turok et al (2011), cel putin la fel de importante precum metaanalizele de studii experimentale din perspectiva puterii dovezilor empirice obtinute prin asemenea demersuri, in timp ce alti autori, precum Scifres, lams, Klebanoff si Macones (2009) sau LeLorier, Gregoire, Benhaddad, Lapierre si Derderian (1997), le considera a fi chiar mai relevante decat rezultatele din metaanalize Studiile randomizate multisite imbina punctele forte ale unui design randomizat cu consecinte pozitive asupra inferentelor legate de validitatea interna a studiului, cu punctele forte ale unui studiu desfasurat in locatii multiple, utile pentru a infera aspecte legate de validitatea externa a concluziilor obtinute Detalii metodologice si statistice introductive despre acest gen de studii pot fi gasite in Kraemer (2000) si Raundenbush si Liu (2000) Dependenta efectului de variatii ale interventiei oferite (de tipul de manipulare a Vi) Efectul Vi asupra VD poate fi dependent de anumite caracteristici ale Vi De exemplu, este posibil ca impactul ascultarii muzicii hip hop asupra agresivitatii adolescentilor sa apara numai in contextul in care se asculta anumiti MC (interpreti) sau ca efectul coaching-ului executiv asupra performantei in munca sa apara numai in cazul in care programul se deruleaza timp de 20 de ore, in locul a 10 ore, in sedinte de grup, dar nu si in cele de coaching individual in aceeasi categorie a dependentei efectului de specificul manipularii Vi intra interactiunea dintre Vi in cazul unor designuri factoriale De exemplu, un medicament poate avea un anumit efect daca este luat singur si un alt efect daca este luat in combinatie cu alte substante cu care interfereaza Pentru a analiza impactul situatiei in care variatii in modul de operationalizare ale Vi afecteaza diferentiat VD, se poate apela la: (a) analize de moderare in cadrul studiilor metaanalitice, pentru a observa impactul acestor caracteristici asupra intensitatii efectului observat la VD; (b) implementarea unor studii cu un design experimental mai complex (de exemplu, a unui design factorial) pentru a testa direct potentialul efect moderator; (c) replicarea efectelor obtinute prin varierea caracteristicilor Vi si sau a modului in care aceasta a fost manipulata (de exemplu, intr-un studiu privind inducerea experimentala a unei bune dispozitii prin tehnica amorsarii (priming) se poate urmari daca efectul apare utilizand stimuli-amorsa diferiti: stimuli vizuali vs verbali, cu o durata de expunere de 100 ms vs 500 de ms etc ) Dependenta efectului de modul de operationalizare al variabilelor, altele decat Vi Atunci cand se are in vedere studierea unei asocieri intre doua constructe sau chiar identificarea unei relatii de tip cauza-efect intre acestea, ar fi important sa observam ca efectul se replica indiferent de modul in care a fost operationalizata variabila masurata insa de multe ori se constata ca efectul este unul semnificativ statistic daca se ia in considerare o anumita variabila, dar devine unul nesemnificativ atunci cand se are in vedere o alta variabila De exemplu, intr-un studiu privind eficienta terapiei rational-emotive comparativ cu tehnicile de relaxare Schultz in reducerea anxietatii, pot fi gasite diferente semnificative statistic daca se au in vedere scorurile la scala de anxietate Hamilton, dar nu apar diferente de eficienta intre cele doua forme de psihoterapie daca se iau in considerare rezultatele la scala de anxietate Zung, cu toate ca ambele probe au fost aplicate pe acelasi lot de subiecti Riscul este valabil si in cazul situatiilor in care obtinem rezultate diferite pentru aceeasi asociere studiata, in conditiile in care s-a apelat la modalitati diferite de operationalizare a variabilelor si la participanti diferiti in legatura cu acest tip de risc, merita adus in discutie exemplul oferit de Heppner, Wampold si Kivlighan (2008), cu privire la dezbaterea dintre adeptii behaviorismului si cei ai curentului psihodinamic vizavi de gasirea celor mai eficiente forme de interventie Daca luam in considerare modificarile comportamentale (in simptomatologie), raspunsul ar fi ca terapiile comportamentale ar fi mai eficiente Daca avem in vedere starea de bine (cat de bine se simte pacientul?), situatia ar putea chiar inclina in directia opusa Astfel, rezultatul este dependent de ceea ce se considera a fi mai important, fapt pentru care s-a introdus distinctia dintre "a te face mai bine" (getting better) si "a te simti mai bine" (feeling better), diferenta care are probabil radacini filosofice in distinctia dintre abordarea pozitivista si abordarea interpretativa O metoda utila de analiza a dependentei rezultatelor (efectelor) de modul in care au fost operationalizate variabilele din studiu este apelul la metaanaliza, un tip de studiu important prezentat pe larg in capitolul 7 Dependenta efectului de mediere (mecanismului cauzal) de contextul studiului Spre deosebire de toate cele patru situatii anterioare care se focalizau pe identificarea unor factori moderatori, acest risc vizeaza gradul de generalizare de replicare a unui factor mediator, ca mecanism cauzal explicativ utilizat pentru relatia dintre Vi si VD Riscul privitor la validitatea externa apare atunci cand mecanismul cauzal identificat intr-un studiu nu se replica intr-altul sau se ajunge la identificarea unui mecanism cauzal alternativ Cu alte cuvinte, efectul obtinut este dependent de mecanisme cauzale diferite, in functie de variatii in contextul (caracteristicile) cercetarii Un astfel de exemplu ar putea fi cazul conditionarii afective Prin conditionare afectiva (evaluative conditioning - EC) se intelege masura in care un stimul neutru (de exemplu, un cuvant abstract si fara sens precum "leinar") primeste in timp o conotatie afectiva pozitiva (daca este asociat repetat cu stimuli neconditionati placuti, cum ar fi fotografii cu bebelusi razand) sau o conotatie afectiva negativa (daca este asociat repetat cu stimuli neconditionati negativi, cum ar fi persoane suferinde, fotografii cu copii maltratati etc ) Aplicatiile acestui tip de conditionare sunt numeroase: de la domeniul publicitatii (Sweldens et al , 2010) la domeniul clinic (Olantunji, Lohr, Sawchuk si Westendorf, 2005) O explicatie (mecanismul cauzal justificativ) oferita pentru acest efect este constientizarea legaturii repetate dintre stimulul neutru si cel neconditionat (De Houwer, 2007) Conform acestui mecanism, valenta afectiva a stimulului initial neutru se va modifica doar dupa ce participantii vor realiza (vor constientiza) legatura repetata dintre stimulul pozitiv si cel neutru Alte studii insa contesta acest mecanism, propunand ca mecanism alternativ atribuirea gresita a valentei afective de la stimulul neconditionat spre cel neutru, acest lucru fiind realizat in mod inconstient (deoarece efectul a fost obtinut uneori in absenta constientizarii legaturii dintre stimulul conditionat si cel neconditionat) Prin urmare, ar fi interesant de urmarit in ce context se activeaza constientizarea legaturii ca mecanism cauzal explicativ pentru aparitia efectului (pentru modificarea valentei afective a stimulului conditionat), respectiv in ce context se activeaza celalalt mecanism cauzal, atribuirea gresita a afectului Clarificari aduse in aceasta directie de studii ar fi extrem de utile in zona cercetarii aplicative, pentru a dezvolta metode eficiente de modificare a atitudinilor in functie de mecanismul cauzal activ in situatia respectiva Dependenta rezultatelor de modalitatea de esantionare utilizata in selectarea participantilor la studiu As adauga in categoria riscurilor privind robustetea rezultatelor o problema clasica intalnita adesea in studii descriptive (non-experimentale), cum ar fi sondajele de opinie Selectarea participantilor prin alte metode de esantionare decat cele probabilistice (de exemplu, prin apelul la un esantion de convenienta), afecteaza atat validitatea statistica a studiului, cat si pe cea externa, fiind improbabil sa se obtina rezultate reprezentative pentru intreaga populatie Cel mai intalnit exemplu pentru a reflecta acest tip de risc este cel al sondajelor de opinie efectuate de diferite site-uri online sau de canale de televiziune De exemplu, raspunsurile la intrebarea "Ati fi de acord cu reluarea demersurilor de suspendare a presedintelui Romaniei, Traian Basescu?" ar fi diferite daca am chestiona telespectatorii canalului B1 TV sau daca am chestiona telespectatorii Antenei 3, iar ambele ar fi distorsionate fata de raspunsurile populatiei generale, deoarece niciunul dintre sondajele respective nu apeleaza la metode probabilistice de selectare a esantionului de participanti chestionati Solutia tipica pentru acest tip de problema este selectarea participantilor la studiu prin metode de esantionare probabilistice (detalii suplimentare fiind oferite in capitolul 6, in sectiunea destinata descrierii anchetelor sociologice) 3 4 4 2 Reprezentativitatea efectelor in contexte aplicative Alaturi de riscurile anterioare ce vizau masura replicarii efectelor, ne putem referi la un tip aparte de dependenta a efectului de contextul cercetarii, cand ne referim la validitatea ecologica Aceasta face referire la masura in care efectele obtinute in studiu pot fi transferate in lumea reala Asa cum se exprima Brewer (2000), rezultatele obtinute pe populatii atipice (studenti la psihologie) si in contexte artificiale (studii de laborator), nu pot fi considerate ca avand o validitate ecologica, pana cand rezultatele se replica in contexte reale, naturale Din perspectiva validitatii ecologice sunt mai intens apreciate studiile derulate intr-un context cat mai natural (realism mundan - de exemplu, in studierea problematicii jocurilor de noroc prin realitate virtuala sau prin studii derulate intr-un cazinou) si indeosebi cele care implica aspecte psihologice similare cu cele care pot fi intalnite in viata reala de catre participanti (realism psihologic) Din acest punct de vedere, studiile efectuate pot fi analizate din perspectiva gradului lor de similaritate cu realitatea si sau cu contextul aplicativ in care se urmareste a se analiza daca s-ar obtine rezultate similare De exemplu, din perspectiva validitatii externe (ecologice), ar exista o probabilitate mai mare sa se replice rezultatul privind eficienta unei interventii educationale de prevenire a abandonului scolar prin implicarea scolarilor in viata comunitatii daca interventia ar fi aplicata pe acelasi grup-tinta pe care a fost testata initial (copii de imigranti), decat daca interventia ar viza alte categorii de grup-tinta, cum ar fi copiii proveniti din familii defavorizate din mediul rural 3 4 5 Dinamica relatiei dintre tipurile de validitate si tipurile de studii Asa cum este o asteptare nerealista ca un studiu sa-si propuna toata pleiada de obiective posibile (exploratorii, descriptive, cauzale), la fel de nerealist este sa ne asteptam ca un singur studiu sa aiba niveluri ridicate de validitate, in toate cele patru aspecte vizate: statistica, interna, de construct si externa De aceea este important sa se acorde o prioritate sporita acelor riscuri privitoare la validitatea concluziilor unui studiu in functie de obiectivele urmarite De exemplu, in cercetarile fundamentale, in care accentul se pune pe explicarea fenomenelor psihologice studiate, indeosebi cu privire la sursa unei relatii de tip cauza-efect, un rol esential il joaca validitatea de construct, respectiv validitatea interna in schimb, in cercetarile aplicative, in care obiectivul major vizeaza masura in care un anumit efect general isi gaseste aplicabilitatea in domenii variate, precum in educatie, in domeniul organizational, in sport etc , o importanta deosebita o are validitatea de construct si cea externa De asemenea, prin definitie, studiile efectuate in conditii de laborator acorda o mai mare atentie aspectelor care tin de validitate interna in dauna celei externe, in timp ce studiile de teren vizeaza indeosebi aspectele de validitate externa, existand posibilitatea aparitiei riscurilor (aspecte externe ramase necontrolate) privitoare la validitatea interna in sfarsit, cu exceptia validitatii statistice, relevanta pentru orice demers metodologic cantitativ, se poate stabili o oarecare asociere intre tipul de obiectiv major vizat de un studiu, anumite particularitati ale designului sau (studii cauzal-descriptive vs studii pragmatice) si tipul de validitate asupra caruia ar trebui sa se acorde mai multa atentie pentru a atinge obiectivul vizat Tabelul 3 11 Relatia dintre obiectivul vizat de studii si importanta diferitelor tipuri de validitate Validitate interna Validitate de construct Validitate externa Obiectiv exploratoriu * ** * Obiectiv descriptiv * ** ** Obiectiv descriptiv-analitic (transversal) * * ** Obiectiv descriptiv-analitic (longitudinal) ** ** ** Obiectiv cauzal-descriptiv (efficacy) *** * * Obiectiv cauzal-pragmatic (effectiveness) ** ** *** Obiectiv cauzal-explicativ (mecanisme *** *** * cauzale) Legenda: *** rol esential; ** rol important; * rol redus De exemplu, in studiile cu cel mai inalt nivel de rigurozitate (cele care isi propun un obiectiv cauzal-explicativ), pentru a oferi o interpretare corecta cu referire la mecanismului cauzal responsabil pentru aparitia efectului, sunt esentiale atat aspectele ce tin de validitatea interna ("exista intr-adevar o relatie cauzala?"), cat si cele care privesc validitatea de construct ("explicatia pentru relatia cauzala este valida?") in schimb, in studiile care vizeaza doar identificarea unei relatii de tip cauza-efect, fara a se centra pe validarea unor mecanisme cauzale responsabile pentru acest fapt, accentul poate fi pus fie pe demonstrarea clara a eficientei unei interventii (prin controlul variabilelor potential confundate, in cadrul unor studii cauzal-descriptive - efficacy), fie pe demonstrarea clara a faptului ca interventia este eficienta intr-un context real (printr-un control mai redus asupra variabilelor potential confundate si o grija sporita pentru validitatea ecologica, in cadrul unor studii pragmatice -effectiveness) in schimb, aspectele de validitate interna isi reduc din importanta in cazul unor studii care isi propun obiective de tip descriptiv, deoarece prin definitie acest obiectiv nu vizeaza extinderea concluziilor dincolo de aspectul pur descriptiv sau predictiv, in timp ce validitatea interna este centrata spre a identifica care dintre relatiile descrise sunt de tip cauza-efect De aceea, in cazul studiilor cu obiective descriptive, ar fi de dorit sa se acorde o importanta mai mare aspectelor care vizeaza validitatea de construct si celor referitoare la validitatea externa Aceste precizari sunt importante in descrierea limitelor unui studiu si in importanta acordata subiectului respectiv in sectiunea de discutii a unui articol Astfel, daca studiul este unul de tip non-experimental, corelational, se poate preciza, desigur, ca nu se poate stabili clar daca relatia identificata este una cauzala sau de alt tip Ceea ce conteaza insa este masura in care relatia este identificata la nivelul ei real de intensitate (validitate statistica), faptul ca masuratorile utilizate in studiu surprind corect constructele utilizate (validitate de construct) si ca rezultatele sunt utile, cu valoare aplicativa ridicata pentru a fi implementate in practica (validitate externa, ecologica) in schimb, daca studiul respectiv este unul experimental, ce urmareste un obiectiv cauzal-explicativ, accentul din partea de discutii este pus pe demontarea eventualelor riscuri privitoare la validitatea interna, respectiv privitoare la validitatea de construct De exemplu, in cazul in care studiul urmareste sa testeze daca cognitiile irationale autodepreciative sunt mecanisme cauzale responsabile pentru eficienta terapiei rational-emotive in combaterea depresiei majore este important sa aratam ca: (a) nu exista alti factori externi interventiei care sa se constituie ca explicatii plauzibile pentru efectul aparut (istoric - alt tratament urmat concomitent, maturare - remiterea spontana a simptomelor etc ); (b) nu exista alte explicatii concurente valide, intrinseci interventiei (efectul se mentine daca controlam statistic efectul placebo, diferentele de asteptari din partea experimentatorului, sau alte tipuri de cognitii irationale masurate, decat cele autodepreciative) Ca urmare a celor precizate anterior si a faptului ca in multe situatii exista un cost al cresterii unei anumite forme de validitate, singura solutie viabila pentru a raspunde treptat la toate riscurile posibile privitoare la problema investigata este aceea de a initia un program de cercetare (un set organizat de studii) menit sa raspunda treptat la toate tipurile de risc existente la adresa intrebarii de cercetat (Shadish et al , 2002) Cel mai adesea, demersul porneste de la un studiu care prezinta rezultate interesante (obiectiv descriptiv sau explorator) Acesta este urmat de o serie de studii menite sa confirme relatia si intensitatea marimii efectului observat (validitate statistica), iar apoi de studii care sa arate ca asocierea se bazeaza pe o relatie de tip cauza-efect (validitate interna) Apoi urmeaza studii care sa ofere explicatii valide pentru relatia cauzala identificata (validitate de construct) si care sa stabileasca cat de robust este efectul si in ce contexte (limite) apare (validitate externa) Alteori demersul este unul invers, cum ar fi situatiile in care se observa un efect robust in diferite contexte si pe diferite populatii, cu privire la asocierea dintre nivelul de epuizare emotionala si performanta profesionala (validitate externa) Aceste rezultate pot conduce mai apoi la un program de cercetare in care sa se stabileasca daca relatia este una cauzala (validitate interna), cat de intensa este (validitate statistica) si cum poate fi ea explicata (validitate de construct) O exemplificare a unui astfel de program de cercetare este oferita in caseta 3 7, in care se combina atat studii de laborator, cat si experimente efectuate in medii naturale in sfarsit, in incheierea sectiunii destinate celor patru tipuri de validitate, trebuie subliniata si in acest caz logica demersului stiintific Validitatea unui efect (privita in ansamblu) este un proces cumulativ bazat pe studii succesive Validitatea nu este niciodata demonstrata, ci doar sprijinita prin rezultatele obtinute si prin masurile de control implementate prin design Caseta 3 7 0 ilustrare a programului de cercetare - relatia cauzala dintre dispozitia afectiva si altruism (starile pozitive inducand o crestere a altruismului; adaptare dupa Brewer, 2000) Programul debuteaza cu o constatare rezultata dintr-un studiu empiric corelational: indivizii cu o dispozitie afectiva mai buna si cei mai optimisti obtin scoruri mai ridicate la o scala de altruism, asadar intre cele doua exista o legatura O parte importanta din program este destinata derularii unor studii experimentale in conditii de laborator cu scopul de a identifica cu claritate faptul ca o dispozitie afectiva pozitiva induce o crestere a nivelului de altruism Pentru a da robustete acestor rezultate, studiile experimentale variaza modalitatea de manipulare a Vi: in unele studii participantii citesc pasaje de text, unele vesele, altele triste; in alte situatii asculta muzica pop energizanta cu mesaj optimist sau sunt alocati audierii unor melodii melancolice, lente, cu mesaj trist; iar in alte situatii primesc un feedback pozitiv sau unul negativ O situatie similara apare si cu referire la VD masurate, acestea variind de la scale consacrate de masurare a nivelului de altruism la situatii experimentale induse - generozitatea financiara dovedita fata de o cauza aparent nerelationata cu studiul (ajutarea sinistratilor in urma unor inundatii) sau disponibilitatea de a oferi ajutor unui complice al experimentatorului Toate aceste variatii inregistrate in studiile experimentale de laborator converg, sustinand ca dispozitia afectiva pare a modifica nivelul de altruism Cu toate acestea, unele critici aduse experimentelor de laborator, scot in evidenta riscuri precum: (a) caracterul artificial al unor sarcini; (b) situatia caracteristicilor sarcinii, aspecte ce pot afecta validitatea externa a rezultatelor, lipsind dovezi cu privire la validitatea ecologica Pentru a elimina aceste critici in contextul pastrarii ideii manipularii Vi, esentiala pentru studiile care vizeaza obiective cauzale, a fost dezvoltat un cvasiexperiment derulat in context natural Astfel, o parte dintre participanti (studenti) a vizionat un film evaluat intr-o etapa de pretestare pe un alt lot de studenti ca fiind trist, iar o alta parte dintre participanti (studenti) a vizionat un film care in pretestare a fost evaluat ca fiind neutru (lotul de control) La iesirea de la cinematograf erau amplasate urne ale Crucii Rosii, unde participantii puteau dona bani pentru o cauza nobila Suma era la latitudinea fiecaruia, nivelul de generozitate financiara constituind VD a studiului O problema cu acest studiu a fost distorsiunea de selectie (participantii si-au ales singuri ce film vor sa vizioneze, ei nefiind distribuiti randomizat in cele doua conditii, pentru a reduce la minimum eventualul impact al reactivitatii participantilor) Astfel, pana dupa momentul parasirii locatiei unde se putea dona pentru Crucea Rosie, situata la iesirea de la film, acestia nu banuiau ca sunt participanti intr-un studiu psihologic Mai mult, pentru a controla eventuale diferente in privinta nivelului de altruism existent de la inceput intre cele doua grupe constituite dupa principii neprobabilistice, in anumite seri locatia unde se putea dona pentru Crucea Rosie era amplasata la intrarea la film Datele au aratat ca, desi nu erau diferente semnificative statistic intre cele doua loturi inainte de vizionarea filmelor, ele exista si replica rezultatele obtinute in laborator daca analiza se face pentru situatiile in care donarea avea loc la iesirea de la film Toate aceste studii converg spre a sustine relatia cauzala dintre dispozitia afectiva si nivelul de altruism, moment in care programul de cercetare poate trece la urmatorul nivel, de oferire clara a unor dovezi ca dispozitia afectiva si nu alte constructe asociate acesteia este intr-adevar responsabila (explicatia) pentru modificarea nivelului de altruism 3 4 6 Problema validitatii in studiile bazate pe o metodologie calitativa Toate aspectele tehnice discutate in sectiunile precedente, de la 3 4 1 la 3 4 5, vizeaza diferite tipuri de validitate aplicabile in cadrul studiilor empirice bazate pe o metodologie cantitativa (cu accent pe studiile experimentale) in cazul studiilor care utilizeaza o metodologie calitativa, problema validitatii inferentelor formulate pe baza datelor colectate ramane de actualitate, chiar daca ea este conceptualizata altfel in acest context, discutia nu se pune in termenii clasici ai celor patru tipuri de validitate, ci prin strategiile specifice metodelor calitative de validare a inferentelor formulate, cu toate ca si in acest caz putem vorbi despre interpretari alternative, replicarea rezultatelor, distorsiuni si artefacte Primul lucru care trebuie inteles de toata lumea este ca metodologia calitativa are o logica diferita de cea cantitativa, de aceea nu trebuie judecata dupa criterii de evaluare specifice validitatii din studiile cantitative Kazdin (2010) afirma ca, spre deosebire de metodologia cantitativa care este interesata sa simplifice lucrurile (cati participanti sunt, ce raspunsuri medii au obtinut, daca sunt diferente intre grupele analizate in medii controlate), metodologia calitativa urmareste mai degraba sa dezvolte (sa complice) lucrurile, pentru a intelege fenomenul studiat asa cum apare el in contextul sau natural Termeni precum semnificatie, intelesuri, reprezentari, care impartasesc toate ideea unor evaluari subiective, constituie puncte centrale intr-un demers calitativ Aceasta modalitate de a face cercetare poate parea ca induce ambiguitate si un subiectivism excesiv, unei persoane obisnuite exclusiv cu abordarea cantitativa Pe de alta parte, desi exista un grup minoritar de autori care fac o opinie separata, cei mai multi, la care subscriu si eu, considera ca studiile calitative pot fi foarte utile numai in anumite scopuri de cercetare, cu precadere sa ajute la descrierea (scop descriptiv) sau la intelegerea si interpretarea fenomenelor studiate (scop exploratoriu) in privinta obiectivelor cauzale, studiile calitative pot fi utile intre anumite limite: (a) fie pentru a genera teorii (explicative) si ipoteze de cercetare care sa fie verificate prin studii cantitative; (b) fie ca metode complementare celor cantitative, in cadrul unor metodologii mixte menite sa ajute la gasirea de explicatii pentru relatiile cauzale analizate (ca urmare a descrierilor bogate obtinute de la participanti si a interpretarilor si semnificatiilor oferite de catre acestia) Ca urmare a acestor precizari rezulta si cele cinci tipuri de validitate specifice unei metodologii calitative (Maxwell, 1992), sintetizate in tabelul 3 12 Dintre acestea, primele trei reprezinta tipuri primare de validitate (importante pentru validitatea inferentelor din studiu), iar ultimele doua reprezinta tipuri secundare de validitate (importante mai degraba pentru a creste increderea sau perceptia ca rezultatele studiului sunt valide) in categoria tipurilor secundare de validitate ar mai putea fi incluse aspecte calitative precum bogatia, expresivitatea sau profunzimea descrierilor si interpretarilor (Whittemore, Chase si Mandle, 2001) Tabelul 3 12 Scurta explicitare a tipurilor de validitate intalnite in studiile calitative Validitate descriptiva Vizeaza masura in care au fost colectate (inregistrate) corect datele oferite de participanti Este nivelul cel mai simplu de validitate implicat si singurul care priveste realitatea factuala, nu pe cea construita Are in vedere descrierea acurata a faptelor povestite, asa cum s-au intamplat acestea Exemplu ipotetic: participantul a declarat ca a aruncat cu un pet de plastic dupa profesor Mijloace de validare: de verificat pe inregistrarile audio daca informatia transcrisa este una corecta (nu au fost distorsionate sau omise elemente descriptive importante) Riscuri: codarea eronata a datelor; probleme in colectarea datelor Validitate interpretativa Vizeaza acuratetea semnificatiei acordate actului descris Sunt oferite interpretari corecte pornind de la opiniile, intentiile si trairile descrise de participanti Vizeaza aspecte ale realitatii construite pornind de la date factuale Exemplu ipotetic: participantul a recurs la acest gest ca un semn de fronda (rezistenta) fata de incercarile profesorului de constrangere a acestuia Mijloace de validare: interpretarea este valida daca respecta perspectiva oferita de actorii implicati si daca, preferabil, se atinge consensul (participantii ofera aceeasi interpretare gestului respectiv) Riscuri: similare cu cele intalnite in operationalizarea constructelor teoretice Validitate teoretica Se ofera explicatii abstracte pentru comportamentul descris si interpretat prin apelul la diverse teorii sociale sau psihologice, mergandu-se dincolo de perspectiva participantilor Este nivelul care implica cel mai mult capacitatea cercetatorului de a extrage esentialul, de a sesiza patternuri care sa conduca la insighturi valoroase despre fenomenul studiat, de a face legaturi intre datele colectate si anumite modele teoretice care faciliteaza descrierea, intelegerea, interpretarea si explicarea fenomenului studiat Exemplu ipotetic: aruncarea petului inspre profesor semnifica un act de fronda din partea elevului, acest comportament facand parte dintr-o simptomatologie mai larga ce se refera la degradarea continua a statutului profesorului in societatea actuala romaneasca si la o criza a valorilor invatate in scoala de astazi Observatie! Prima parte din exemplu, aruncarea petului ca act de rezistenta, poate fi perceput ca un demers invers intalnit in validitatea de construct (rezistenta fiind constructul vizat, iar actul de aruncare a petului, modalitatea de operationalizare) in schimb, cea de-a doua parte a exemplului (rezistenta ca parte a unei crize majore a sistemului educational actual, a degradarii statutului profesorului) ar putea fi analizata din perspectiva validitatii interne, astfel ca preocuparea de baza devine aceea de a elimina alte posibile "cauze" care sa explice rezistenta elevului Acest lucru pare la prima vedere un demers eminamente speculativ, insa el poate fi corectat de catre cercetator prin punerea in comun (triangulare) a celorlalte informatii de care dispune, cateva zeci de pagini de transcrieri a interviurilor de profunzime efectuate Mijloace de validare: explicatia este valida daca (a) este recunoscuta de catre participanti ca o cauza posibila, preferabil atingandu-se consensul, (b) teoria utilizata pentru a explica fenomenul studiat este fundamentata empiric (exista dovezi in sprijinul acesteia) Riscuri: distorsiunea indusa de cercetator, omiterea datelor discrepante fata de modelul teoretic propus, omiterea unor explicatii alternative Validitate externa (generalizare) Prin aceasta se urmareste masura in care modul de descriere, interpretare si sau explicare a fenomenului studiat poate fi relevant (valabil) si pentru alte persoane sau contexte De retinut insa ca nu sunt cautate interpretari valabile pentru toti participantii la studiu, ci pentru cat mai multi dintre ei, recunoscandu-se unicitatea si viziunea individuala a fiecaruia in acest sens, generalizarea poate avea in vedere masura in care explicatia teoretica utilizata are sens, nu numai pentru un alt participant, ci si pentru alte comportamente specifice (decat aruncarea petului) ideea generalizarii in studiile calitative nu se rezuma doar la aspecte tehnice precum obtinerea unor rezultate similare pe alti participanti sau utilizand alte metode de cercetare pentru colectarea datelor, ci urmareste, indeosebi gradul de extindere (valabilitate) a interpretarilor si a explicatiilor teoretice oferite Exemplul ipotetic: aruncarea petului este numai unul dintre actele de fronda facute; la acesta se adauga distrugerea mobilierului scolar, negocierea notelor cu profesorul, preluarea apelurilor telefonice in timpul orei; toate acestea converg catre ideea unei crize majore a sistemului educational de azi Mijloace de validare: masura in care in urma studiului, aspectele generale (abstracte) sunt potrivite pentru a descrie contexte specifice, in care situatii particulare pot fi descrise, interpretate sau explicate prin apelul la un nivel categorial superior (aruncarea petului - categorie inferioara vs act de indisciplina - categorie superioara) sau mai abstract de analiza si care sa fie relevant pentru cat mai multi participanti Riscuri: reproductibilitate scazuta a rezultatelor si interpretarilor formulate Validitate evaluativa Prin aceasta se urmareste validitatea interpretarilor pe care le face cercetatorul fata de comportamentele observate Astfel, daca validitatea interpretativa ofera perspectiva participantilor cu privire la semnificatia comportamentelor descrise, validitatea evaluativa se refera la punctul de vedere al cercetatorului, la semnificatiile pe care el sau ea le acorda comportamentelor observate Acest tip de implicare subiectiva a cercetatorului, inclusiv la nivelul acordarii unor semnificatii diferite de cele ale participantilor, este o actiune legitima in cercetarea calitativa Exemplu ipotetic: gestul elevului este un strigat de ajutor, o modalitate de semnalizare a prezentei sale si a faptului ca a fost neglijat de catre profesor Mijloace de validare: nivelul de suport existent in datele colectate pentru aprecierile subiective facute Riscuri: similare cu cele specifice validitatii de construct; transfer si proiectii personale, fara legatura cu datele colectate Alaturi de aspectele mentionate anterior, in aprecierea studiilor calitative au fost introduse o serie de concepte relevante pentru problematica validitatii De exemplu, conceptul de triangulare se refera la utilizarea unor proceduri sau surse multiple de informare care converg pentru a sustine aceeasi concluzie Utilizarea ei ca tehnica de lucru creste probabilitatea validarii inferentelor pentru toate tipurile de validitate, oferind mai multa plauzibilitate descrierilor, interpretarilor si explicatiilor oferite Strans legat de acest concept este cel de credibilitate O interpretare este credibila daca este facuta intr-o maniera coerenta, cursiva si in care, atat participantii, cat si cercetatorul, se regasesc ca descriere in sfarsit, un alt concept important este cel de reproductibilitate, care vizeaza masura in care un alt cercetator decat cel implicat ar putea ajunge la aceleasi concluzii, ca urmare a unui demers transparent si sistematizat de colectare si analiza a datelor (Kazdin, 2010) impreuna, indiferent de nivelul de validitate vizat, plauzibilitatea, credibilitatea si reproductibilitatea, contribuie semnificativ la considerarea inferentelor formulate ca fiind unele valide 3 5 O perspectiva pragmatica asupra ciclului natural de cercetare in linii mari, in marketing exista o linie directoare clara care porneste de la analiza nevoilor clientilor si identificarea unei nevoi de satisfacut, continuata cu dezvoltarea unui produs serviciu care sa raspunda acestora, cu stabilirea unei strategii de marketing legate de lansarea acestuia si apoi de strategii de castigare a unei cote cat mai mari de piata Acelasi lucru se intampla si in domeniul tehnologiei Ca urmare a extinderii cunoasterii ca rezultat al cercetarilor fundamentale, poate fi conceputa si mai apoi testata eficienta unei inovatii menite sa amelioreze sau sa optimizeze o anumita tehnologie, prin care sa se raspunda mai bine nevoilor existente pe piata Dupa numeroase testari sunt eliminate problemele identificate si este realizat prototipul final Acesta este prezentat clientilor interesati direct, care pot decide sa treaca la productia de serie in psihologie nu exista obisnuinta de a se gandi in termenii unei priviri de ansamblu, cum ar fi aceea de a urmari etapele cunoasterii de la identificarea unei probleme psihologice pana la stadiul final de diseminare si oferire de servicii, incluzand cele mai eficiente solutii identificate pentru problema respectiva intre motivele care contribuie la aceasta situatie este faptul ca un ciclu complet (de la cercetare fundamentala, la cercetare aplicativa, iar mai apoi la cercetare pentru dezvoltare - inovare) dureaza semnificativ mai mult (uneori o viata de om) decat situatia tipica legata de ciclul de viata al unui produs sau serviciu in marketing sau in inginerie Un alt motiv il constituie relativa focalizare a cercetatorilor, fie in zona cercetarii fundamentale, fie in cea a cercetarii aplicative insa absenta unei gandiri pragmatice cu privire la ciclul natural al cercetarii pe o anumita tematica din psihologie nu ar trebui sa persiste, datorita beneficiilor multiple pe care le aduce o astfel de perspectiva pragmatica de ansamblu Din acest punct de vedere, figura 3 7 sintetizeaza toate caracteristicile principale urmarite printr-un astfel de demers, avand drept fir logic de start focalizarea pe cunoasterea problemei investigate (cel mai adesea adresabila prin cercetarea fundamentala), iar ca punct final demersuri specifice cercetarii aplicative si cercetarii pentru dezvoltare-inovare (focalizarea pe identificarea de solutii care sa imbunatateasca starea de fapt) Din punctul de vedere al tipului de studii efectuate, in partea stanga a figurii 3 7 se regasesc intr-o mai mare masura studii care urmaresc obiective exploratorii sau descriptive, deoarece procesul de cunoastere evolueaza gradual dinspre clarificarea problemei investigate inspre identificarea mecanismelor cauzale responsabile pentru aparitia ei Obiectivele cauzal-descriptive, respectiv cauzal-explicative se pot intalni in intregul ciclu de studiu al unei problematici, fiind insa masuri obligatorii pentru studiile focalizate pe interventii (solutiile oferite - partea din dreapta a figurii 3 7) Asadar, logica stiintifica apeleaza adesea la un asemenea demers, intai aparand preocuparea pentru a conceptualiza fenomenul studiat, iar mai apoi de a gasi solutiile aplicative potrivite care sa amelioreze problema constatata Focalizarea pe cunoasterea problemei Focalizarea pe solutie • Descrierea si definirea problemei • Gravitatea problemei (incidenta si prevalenta, consecinte, costuri) • Operationalizarea conceptului (dezvoltarea unor instrumente de masurare) • Construirea retelei teoretice (studii de validitate convergenta si divergenta, incrementala, analiza multinivelara etc ) • identificarea factorilor proiectivi si a celor de risc • Dezvoltarea de modele teoretice integrative in scop predictiv explicativ (mecanisme ale schimbarii) • Design-ul interventiilor (solutiilor) si testarea eficientei acestora • Testarea (validarea) mecanismelor schimbarii implicate • Adaptarea si optimizarea solutiilor • Diseminarea protocoalelor de interventie Studii descriptive cantitative (ex sondaje etc ) sau bazate pe metodologii calitative Studii non-experimentale transversale Studii non-experimentale longitudinale Studii metodologice Studii experimentale Sinteza probabila: nietaanaliza efectuata pe studii non-experimentale Studii experimentale (cvasi-experimentale): identificarea unei relatii cauza-efect (studii de eficienta) J identificarea mecanismelor schimbarii (factori mediatori) Generalizarea rezultatelor-factori moderatori, context ecologic (studii pragmatice) Analiza raportului cost-eficienta Sinteza probabila: nietaanaliza efectuata pe studii experimentale Figura 3 7 Ciclul stiintific natural al studierii unui aspect psihologic - o viziune pragmatica Pentru a intelege ciclul de cunoastere al unei tematici, voi ilustra prin tema epuizarii emotionale (burnout) descrisa pentru prima data in anii '70, care a cunoscut o expansiune extraordinara (peste 6 000 de publicatii; Schaufeli, Leiter si Maslach, 2009) Tabelul 3 12 ilustrarea aspectelor centrale din ciclul natural stiintific in cazul problematicii epuizarii emotionale (burnout) Aspecte generale (obiective vizate) ilustrare la nivelul studierii epuizarii emotionale Descrierea si definirea problemei (obiective Conceptul de burnout a fost introdus la mijlocul anilor '70 exploratorii sau obiective descriptive de Maslach (1976), respectiv Freudenberger (1975), ca o propriu-zise) Cele mai intalnite tipuri de studii care raspund acestor nevoi sunt studiile de caz si studiile bazate pe o metodologie calitativa Aceste demersuri sunt menite sa faciliteze intelegerea fenomenului studiat si sa identifice atributele caracteristice, necesare si definitorii pentru fenomenul semnalat Aceasta etapa este obligatorie pentru orice construct studiat, fiind faza in care se ajunge (de cele mai multe ori) la un consens cu privire la definirea si sfera de includere a constructului respectiv Extinderea si gravitatea problemei (obiective descriptive propriu-zise sau descriptiv-analitice) intr-o societate care actioneaza in baza unui model cu resurse limitate ar fi ideal sa se stabileasca gradul de raspandire a problemei identificate si directia evolutiei acesteia (de exemplu, o problema tot mai des intalnita) prin studierea prevalentei fenomenului (numarul de cazuri existente) si a incidentei acestuia (numarul de cazuri nou-aparute), precum si a consecintelor (costurilor) la nivel social, economic etc Cele mai intalnite tipuri de studii din aceasta sfera sunt studiile non-experimentale descriptive, cum ar fi sondajele de opinie, studiile corelationale sau analiza de costuri prima incercare de sistematizare a unei serii de studii de caz si a unor observatii din practica organizationala, conform careia o parte din angajati ajung sa fie extenuati mental si sa le scada nivelul de implicare in munca, aceasta pierzandu-si din semnificatie Pe baza acestor studii exploratorii si descriptive s-a ajuns la o definire a conceptului (Maslach, 1981) si la o descriere a procesualitatii fazelor de burnout (Freudenberger, 1982 apud Kaschka, Korczak si Broich, 2011) Problema este destul de raspandita in populatia generala de angajati, fiind observata o prevalenta a fenomenului la un grad de severitate ridicat (burnout clinic) cuprins intre 4% si 7%, ce poate ajunge chiar la 10% in profesiile care presupun un contact uman sustinut (cadre didactice, medici de familie, comercianti etc ) (Schaufeli, 2003) Prin gravitatea consecintelor existente la nivel personal, burnoutul a fost inclus in iCD-10, iar prin consecintele negative la nivel de organizatie (fluctuatie de personal, absenteism, scaderea satisfactiei in munca) a devenit o preocupare curenta pentru specialistii in resurse umane (Kaschka et al , 2011) Operationalizarea conceptului (obiective descriptiv-analitice) in aceasta categorie intra studiile metodologice centrate pe dezvoltarea, adaptarea sau rafinarea unor instrumente psihologice necesare pentru a masura constructul evaluat (studii descriptiv-analitice) Ele se afla in stransa legatura cu definirea si descrierea problemei, respectiv cu stabilirea si identificarea unei retele instrumentul de baza utilizat pentru a masura nivelul epuizarii emotionale este MBi (Maslach Burnout inventory) (Maslach si Jackson, 1986 apud Schaufeli, 2003) Acesta are trei versiuni: una pentru cadre didactice alta pentru alte profesii ce implica contact uman frecvent (oferirea de servicii), iar cea de-a treia versiune, generala, pentru alte tipuri de slujbe Toate acestea redau cele trei dimensiuni majore ale conceptului: cel de extenuare, cel de depersonalizare si cel de realizari personale scazute (ineficienta) Desi au fost dezvoltate alte instrumente (conexiuni) teoretice intre constructul examinat si alte constructe relevante concurente, multe dintre acestea sunt focalizate doar pe surprinderea extenuarii ca o subcomponenta a epuizarii emotionale, neglijand partea care vizeaza distantarea fata de munca (prin depersonalizare si ineficienta) Construirea retelei teoretice (obiective descriptiv-analitice) in aceasta categorie intra studiile orientate spre construirea retelei nomotetice dintre constructul analizat si alte constructe relevante De exemplu, studiile orientate spre validarea incrementala, cele de validitate convergenta sau divergenta, intra in aceasta categorie Tot aici s-ar include si studiile non-experimentale focalizate pe identificarea de moderatori sau mediatori ai relatiei dintre constructul masurat si alte variabile Maslach, Schaufeli si Leiter (2001) trec in revista o serie de distinctii importante intre burnout si alte constructe similare cum ar fi stresul la locul de munca, suprasolicitarea, insatisfactia legata de locul de munca sau depresia Opusul ideii de burnout ar fi cea de angajament organizational in sfarsit, se stabilesc relatii intre burnout si o multitudine de variabile din zona organizationala precum ambiguitatea de rol, conflictul de rol, relatiile cu colegii si cu superiorii, nivelul de absenteism, satisfactia la locul de munca, comportamentele contraproductive etc Aceeasi autori subliniaza ca stima de sine scazuta sau un locus al controlului extern joaca in rol moderator, facilitand aparitia burnoutului experimentale longitudinale, care permit identificarea clara a ordinii in succesiunea trairilor psihice De exemplu, este burnoutul o consecinta a unei satisfactii scazute la locul de munca sau este o cauza care contribuie la scaderea satisfactiei legata de munca? Burnoutul are drept consecinte o serie de manifestari negative precum identificarea factorilor protectivi si ai celor in acest caz se apeleaza indeosebi la studii non-de risc (obiective descriptiv-analitice si obiective cauzal-descriptive) Aceasta directie de studii poate fi inclusa in categoria construirii unor retele teoretice, insa am preferat abordarea ei distincta pentru a sublinia faptul ca se are in vedere gasirea acelor determinanti (factori) care pot depresia, anxietatea etc sau este un rezultat al acestor facilita sau inhiba aparitia fenomenului respectiv Printr-un asemenea demers predictiv, situat la granita dintre un demers descriptiv si unul cauzal, pot fi identificate categoriile vulnerabile (persoane care prezinta multipli factori de risc si nu dispun ca resurse de factorii protectori) si se pot testa anumite presupozitii cu privire la cauzele aparitiei fenomenului respectiv, cu limitarile metodologice de rigoare Studiile non-experimentale transversale, dar mai ales natura categoriala (prezent vs absent), pot aparea eronat, stari? in pofida importantei acestor raspunsuri, exista putine studii longitudinale pe aceasta tema (Schaufeli, 2003) Ele par a sugera o cauzalitate reciproca in cazul aspectelor de sanatate (starile negative faciliteaza burnotul, care la randul sau intretine o stare psihica negativa) si induc o serie de consecinte negative la nivel organizational (insatisfactie profesionala) Studiile de tip longitudinal pot induce insa in eroare din cauza naturii cronice a burnoutului in lipsa unei variabilitati in scorurile de la MBi, indeosebi in cazul operationalizarii de cele longitudinale, fie ele de tip corelational sau comparativ, sunt studiile utilizate cel mai des pentru a surprinde potentialii asocieri nesemnificative statistic cu alti factori de risc sau protectori Alternativa la studiile longitudinale vizeaza moderatori sau mediatori ai fenomenului studiat Dezvoltarea de modele teoretice integrative in scop predictiv explicativ (analiza mecanismelor schimbarii) (orice tip de obiectiv, preferabil obiective de tip cauzal-explicativ) Pe masura acumularii de cunostinte despre fenomenul studiat, indeosebi a dezvoltarii retelei de constructe teoretice si a determinantilor (factori de risc, factori protectori) pentru efectul observat, se pot dezvolta modele sau teorii care sa prezica si sau sa explice evolutia fenomenului studiat Cel mai adesea, pentru a testa asemenea modele se apeleaza la studii experimentale ce-si propun scopuri cauzal-explicative, insa atunci cand acest lucru nu este posibil sunt luate in considerare dovezi indirecte provenite din alte tipuri de studii implementarea unor modele structurale (de exemplu, analiza de cale) in cadrul unor studii non-experimentale transversale, prin care o serie de caracteristici ale locului de munca (de exemplu, autonomia decizionala etc ) au fost conceptualizate ca antecedenti ai burnoutului, in timp ce alti factori (de exemplu, atitudinea negativa fata de locul de munca) sunt percepute drept consecinte ale acestui fenomen Din punct de vedere teoretic au fost dezvoltate mai multe modele explicative pentru aparitia burnoutului (la nivel individual, la nivel interpersonal, la nivel organizational si la nivel societal), insa pentru foarte putine dintre acestea exista un suport empiric direct (Schaufeli, 2003) Una dintre cele mai cunoscute conceptualizari vede epuizarea emotionala ca o consecinta a inegalitatii schimburilor de la locul de munca (angajatii resimt ca au daruit s-au implicat prea mult, comparativ cu cat au primit inapoi, fiind vorba astfel de un efort nerasplatit, indiferent daca avem in vedere seful direct sau intreaga organizatie ca sursa a insatisfactiei) (Schaufeli, 2003) Un alt model celebru a fost dezvoltat de Demerouti et al (2001), burnoutul fiind considerat rezultatul unui dezechilibru intre solicitarile de la locul de munca si resursele psihologice disponibile pentru a face fata la acestea Presiunea indusa de solicitari conduce indeosebi la extenuare, in timp ce lipsa resurselor contribuie indeosebi la dezangajare in sarcina (scaderea implicarii) Designul interventiilor si testarea eficientei Van der Klink, Blonk, Schene si Van Dijk (2001) au acestora (obiective cauzal-descriptive) in urma acumularii unui numar mare de cunostinte despre problema studiata, pot fi concepute si evaluate o serie de programe menite sa diminueze sau sa elimine problema respectiva Modalitatea standard de testare a eficientei interventiilor propuse este apelul la studii cauzal-descriptive (efficacy studies) identificarea mecanismelor schimbarii (obiective cauzal-explicative) efectuat o metaanaliza privind eficienta interventiilor menite sa reduca nivelul de burnout, rezultate incurajatoare fiind obtinute pentru programele cognitiv-comportamentale si, secundar, pentru interventiile bazate pe tehnici de relaxare Totusi, se observa ca cele mai multe interventii utilizate nu sunt specifice exclusiv burnoutului, ci vizeaza aspecte mai generale cum ar fi combaterea depresiei, a stresului etc (Schaufeli, 2003) Nu au fost identificate studii care sa includa explicit masuri de testare a unor mecanisme cauzale odata cu Daca impreuna cu testarea eficientei unei interventii se iau masuri suplimentare de a identifica ingredientul activ, responsabil pentru aparitia schimbarii, se urmaresc obiective cauzal-explicative Modalitatea standard de testare a acesteia presupune studii cauzal-descriptive, avand un design special care sa permita identificarea mecanismelor schimbarii testarea eficientei unei interventii la nivel de burnout De fapt, de cele mai multe ori burnoutul a fost utilizat ca un construct de tip "umbrela" pentru a explica relatia dintre un factor antecedent (de exemplu, ambiguitatea de rol) si o consecinta (de exemplu, insatisfactia profesionala) Majoritatea studiilor efectuate pentru a testa eficienta interventiilor menite sa reduca nivelul de epuizare Adaptarea si optimizarea solutiilor (obiective cauzal-descriptive) in urma derularii studiilor cauzal-descriptive emotionala se constituie, in realitate, ca studii pragmatice, si a celor cauzal-explicative, identificam cu derulate in mediul natural al participantilor si fara criterii claritate daca interventia este una eficienta si dure de includere excludere a celor chestionati din analiza care sunt ingredientele active (mecanismele responsabile pentru eficienta) insa aceste rezultate nu asigura faptul ca interventia este eficienta in orice context si pe participanti neselectati special Nu sunt clare nici limitele eficientei interventiei (variabilele moderatoare) De aceea, pentru a raspunde acestor neajunsuri se apeleaza la studii pragmatice (effectiveness studies) Prin acest gen de studii se are in vedere evidentierea robustetii eficientei interventiei in contexte naturale variate, pornind de la premisa ca este importanta reproducerea efectelor in conditii asemanatoare cu cele din realitate Asadar se poate spune ca interventiile respective sunt eficiente inclusiv in conditii asemanatoare cu cele din realitate Dintre interventiile analizate, cele care combina interventii la nivelul individului cu masuri ameliorative la nivel organizational conduc la efecte benefice pe o perioada mai lunga de timp decat cele implementate doar la nivel individual (Awa, Plaumann si Walter, 2010) Diseminarea protocoalelor de interventie in in domeniul consultantei manageriale (atat la nivelul practica Aceasta componenta de cercetare, specifica categoriei cercetare-inovare-dezvoltare, vizeaza implementarea in activitatea practica a interventiilor care au trecut de filtrele anterioare Dincolo de aspectul transferului de servicii psihologice inovative in practica profesionala, in acest stadiu se pot avea in vedere studii cantitative sau calitative menite sa identifice masura in care companiilor de top ca Deloitte, Bain, BCG sau McKinsey, cat si a firmelor mici de consultanta) se pot oferi pachete de interventie menite sa reduca nivelul de burnout Ele pot avea ca suport diseminarea celor mai bune practici in domeniu, menite sa reduca nivelul de epuizare emotionala in una sau mai multe arii precum motivare, autonomie, valori etc prezentate in manuale de profil precum Maslach si Leiter (1997) sau Leiter si Maslach (2005) La fel de utile se pot dovedi si programele generale de imbunatatire a sanatatii mentale, cu efecte pozitive indirecte si la nivel de burnout De exemplu, programul de beneficiarii acestor interventii le accepta si apreciaza (complianta la interventie), precum si analize focalizate pe avantaje colaterale (cum ar fi un echilibru mai ridicat munca-viata de familie) sau pe castigul obtinut asa cum rezulta in urma unei analize de cost-eficienta reducere a stresului bazat pe meditatie mindfulness este aplicat in peste 200 de organizatii din lumea intreaga cu scopul de a preveni burnoutul (Goutas, 2008) 3 6 intrebarea studiului - strategii de selectare a ideilor de cercetat Lecturand literatura de specialitate pe o anumita tematica, ni s-a intamplat poate multora dintre noi sa ajungem sa afirmam ca s-au scris atat de multe despre tema respectiva incat nu ar mai putea fi nimic nou de spus Scopul acestei sectiuni finale a capitolului destinat analizei critice a demersului de cercetare este de a oferi sugestii celor interesati cu privire la posibile idei de cercetat, inclusiv in acele domenii care par a fi deja batatorite Desigur, o prima posibilitate este oferita de modelul pragmatic al ciclului stiintific natural, descris in sectiunea anterioara in baza acestuia pot fi adresate o serie de intrebari precum: "cat de extinsa este problema (prevalenta)?", "care sunt factorii de risc antecedenti?", "exista interventii eficiente pentru a preveni si sau combate problema?" etc O alta posibila viziune este schematizata in figura 3 8, reprezentand o adaptare dupa Howitt si Cramer (2000) Conform acestuia, una dintre sursele generative de idei de cercetare este analiza critica a cercetarilor existente pentru a evalua: (a) masura in care afirmatiile continute au acoperire empirica (sunt valide intern, extern, la nivel de construct si statistic), propunand, acolo unde este cazul, noi studii cu metodologii adecvate, menite sa corecteze eventualele aspecte ramase descoperite; (b) masura in care rezultatele obtinute converg spre acelasi rezultat sau conduc la rezultate mixte, contradictorii, propunand fie sinteze de tip metaanalitic pentru a surprinde efectul mediu global si eventualii factori mediatori sau moderatori, fie studii empirice cu un design care sa ofere explicatii sugestii cu privire la sursa efectelor contradictorii obtinute Tot din analiza literaturii de specialitate pot rezulta idei de cercetare provenite din: (a) sugestiile oferite de autorii studiilor cu privire la posibile directii viitoare de studiu; (b) testarea unor afirmatii (continuturi teoretice) care nu au fost abordate empiric sau care au fost tratate intr-o maniera insuficienta pentru a putea aprecia gradul de sprijin empiric existent pentru acestea in sfarsit, a treia categorie de surse de idei vizeaza o abordare diferita de cele anterioare Daca in cazurile precedente ideile de cercetare erau bazate pe un fundament teoretic solid si constituie cel mai adesea un demers logic de tip deductiv (dinspre teoretic spre empiric), idei de cercetare pot rezulta si printr-un demers de tip inductiv, de la o realitate relevanta de cercetat spre o conceptualizare teoretica ulterioara Aici ar putea intra (a) atat nevoia de a oferi raspunsuri la probleme noi cu care se confrunta societatea actuala (de exemplu, studierea eficientei terapiilor realizate online, a impactului retelelor de comunicare sociala de tipul Facebook asupra vietii de cuplu etc ), (b) cat si ideile avand drept sursa insighturi personale, precum si problemele de zi cu zi cu care se confrunta cercetatorul (de exemplu, daca cercetatorul observa din activitatea de consultanta ca persoanele agreabile primesc in general evaluari mai bune din partea supervizorilor decat cele mai putin agreabile, isi poate pune problema daca agreabilitatea este intr-adevar un predictor al performantei profesionale sau daca relatia evidentiaza o distorsiune in evaluare, aceea de a evalua mai intens pozitiv pe cei cu un stil de relationare interpersonala placut) Afirmatii sau explicatii cu caracter speculativ (cu o validitate redusa) care necesita o alta abordare metodologica pentru a putea fi testate Noi dezvoltari tehnologice sau probleme sociale aparute care necesita investigatii suplimentare insighluri personale sau aspecte ce starnesc curiozitatea ca urmare a experientelor traite Aspecte ale unei teorii psihologice care nu au fost testate corespunzator sau nu au fost abordate empiric Sugestii (directii viitoare dc studii) oferite dc autorii studiilor Rezultate inconcludcnic sau contradictorii obtinute in studii anterioare sau demersuri de sintetizare a rezultatelor anterioare Figura 3 8 Ciclul stiintific natural al studierii unui aspect psihologic - o viziune pragmatica Data fiind importanta acordata problemelor de validitate ale unei cercetari prezentate pe parcursul acestui capitol, voi oferi cateva detalii despre modul concret in care pot fi gasite idei de cercetare pornind de la analiza validitatii concluziilor unui studiu Cel mai probabil, aceasta sursa de idei are cel mai ridicat nivel de fertilitate, indeosebi in contextul actual de cercetare, in care suntem confruntati cu o explozie de studii care ne determina sa credem ca este dificil sa aducem contributii originale, ca lucrurile importante despre un subiect de cercetat au fost spuse deja Lista acestor propuneri este prezentata in tabelul 3 13, fara a avea pretentia de a fi o lista exhaustiva Tabelul 3 13 idei de studiu pornind de la analiza validitatii rezultatelor studiilor anterioare Tip de situatie Simptomatologie (ilustrare) Solutie (ilustrare) Efect nedetectat ipoteza studiului nu este sprijinita, nefiind obtinuta o corelatie semnificativa statistic intre nivelul de constiinciozitate si performanta in munca Validitate statistica Posibile cauze pentru aceasta stare de fapt sunt restrictia de amplitudine sau o consistenta interna scazuta a variabilelor masurate si, in general, o putere statistica scazuta asociata ipotezei testate Solutia: de aplicat aceeasi idee de cercetare pe un lot mai mare si mai eterogen, cu instrumente avand proprietati psihometrice superioare Validitate interna Cu toate ca aspectele de validitate interna au in vedere validarea afirmatiilor de tip cauzal, am putea discuta si in cazul acestui studiu corelational de probleme de instrumentare De exemplu, daca evaluarea performantelor in munca se face de catre supervizori diferiti, dupa bunul lor plac, fara a exista o metodologie comuna de apreciere, se pot introduce erori de instrumentare care sa conduca la rezultate nesemnificative statistic Solutia: preferabila ar fi utilizarea unor indicatori hard (obiectivi) de apreciere a performantei in munca sau apelul la un training de profil si la niste ancore comportamentale de evaluare, daca se apeleaza la evaluari soft (subiective) Validitate de construct O posibila explicatie ar fi utilizarea unui instrument mai putin cunoscut (eventual cu probleme privind validitatea convergenta) pentru a masura constiinciozitatea Solutia: atat pentru constiinciozitate, cat si pentru aprecierea performantelor ar trebui utilizate instrumente consacrate sau alte metode decat cele utilizate initial (de exemplu, masuri obiective ale criteriului in locul evaluarilor oferite de supervizori); o alta directie posibila ar viza descompunerea constructului constiinciozitate pentru a urmari care dintre fatetele sale (de exemplu, prudenta) coreleaza sau nu cu performanta in munca Validitate externa Este posibil ca relatia dintre constiinciozitate si performanta in munca sa fie nesemnificativa pentru ca s-a apelat la un lot de actori Solutia: se replica studiul apeland la un lot de sportivi de performanta sau pe un lot de consultanti financiari; se poate modifica contextul testarii, aplicandu-se proba in context de selectie, nu intr-unul tipic situat temporal la momentul postselectiei Efect detectat ipoteza studiului este sustinuta, un nivel mai ridicat al anxietatii sociale fiind inregistrat in cazul celor din grupul de control de tipul listei de asteptare comparativ cu cei din grupul experimental, care au urmat trainingul de asertivitate Validitate statistica Cel mai probabil, acest tip de validitate nu ridica probleme in cazul descris cu doua exceptii: (a) situatia raportarilor selective (limitam discutia la sfera anxietatii sociale si concluzionam ca trainingul este unul eficient, desi nu au aparut diferente intre cele doua grupe cu privire la alte variabile studiate precum asertivitatea, empatia, stima de sine etc , singura diferenta inregistrata fiind la nivelul anxietatii sociale - care ar fi putut iesi semnificativa statistic din intamplare - eroarea setului de comparatii); (b) situatia putin probabila a derularii studiului cu o ipoteza de lucru careia ii este asociata o putere statistica foarte mare Solutia: alegerea unei variabile dependente principale si derularea studiului in conditiile unei puteri statistice optime Validitate interna Daca rezultatul a fost obtinut in absenta randomizarii prealabile a participantilor, rezultatul poate fi provocat de distorsiuni de selectie Daca exista randomizare, este posibil ca rezultatul obtinut sa fie cauzat de alte aspecte precum pierderea selectiva a participantilor (doar 55% dintre persoanele din lotul de control au fost disponibile pentru evaluare la nivel de postinterventie comparativ cu 80% din grupul care a primit interventia) Solutia: apelul la studii randomizate individual sau la nivel de cluster in locul celor de tip cvasiexperimental, cu derularea studiului in mai bune conditii pentru a evita probleme tipice precum pierderea selectiva a participantilor, istoricul etc Validitate de construct Daca rezultatul este unul pozitiv se pune intrebarea: care ar fi explicatia pentru acest rezultat? Sa fie simplul fapt ca indivizii din grupul experimental au beneficiat de atentie speciala? Sa fie din cauza faptului ca trainingul, prin expunere repetata la situatii sociale, scade nivelul de stres al participantilor la studiu, astfel incat acestia nu mai sunt la fel de anxiosi social? Solutia: pentru a vedea daca efectul se datoreaza trainingului propus si nu altor factori nespecifici se apeleaza la un altfel de grup de control, de tipul interventiei placebo; pentru a oferi explicatii privind efectul gasit se pot introduce masuratori ale posibilelor mecanisme ale schimbarii, pentru a testa efectul acestora Validitate externa Poate fi replicat rezultatul in alte contexte? De exemplu, pe subiecti care au un nivel clinic al anxietatii sociale? Sau in contextul in care trainingul este livrat colectiv, nu in sedinte individuale? in tari cu o cultura colectivista fata de cele care au o cultura individualista? Etc Solutia: implementarea programului de training in contexte cat mai variate si pe participanti cat mai diferiti, pentru a urmari gradul de generalizare a rezultatelor Alte situatii des intalnite Efect stabil robust Din multe studii reiese faptul ca terapia cognitiv-comportamentala (TCC) este eficienta pentru a diminua simptomatologia depresiva (rezultate semnificative statistic) Solutia: Daca efectul a fost replicat in contexte variate se pot cauta explicatii (factori mediatori) pentru legatura dintre Vi si VD De exemplu, se poate testa masura in care un anumit tip de cognitii irationale, precum sunt cele autodepreciative, pot juca rolul unor variabile mediatoare, astfel incat terapia sa modifice mai intai nivelul acestor cognitii, care la randul lor au un impact asupra nivelului de depresie Efect variabil (eterogen) Din studii diferite reies rezultate eterogene, astfel incat in unele cazuri se sustine empiric ideea ca TCC are rol benefic in combaterea depresiei, iar in alte studii nu se replica acest rezultat pozitiv, nefiind inregistrate diferente semnificative statistic Solutia: introducerea in studiu a unor variabile moderatoare pentru a analiza situatiile in care efectul este unul mai puternic, respectiv unul absent sau mai slab dezvoltat Replicarea conceptuala intr-un studiu s-a demonstrat ca vizionarea de filme agresive (grupul experimental) vs filme documentare (grupul de control) conduce la un nivel mai ridicat al agresivitatii de stare masurata printr-o scala de tip self-report Acest gen de rezultat este cu atat mai robust cu cat poate fi replicat prin apelul la alte modalitati de operationalizare decat cele folosite initial Solutia: de exemplu, cei din grupul experimental sunt amorsati cu o serie de cuvinte cu sens din sfera agresivitatii (cuvinte cu o conotatie agresiva), in timp ce participantii din grupul de control au fost amorsati cu o serie de cuvinte neutre VD a fost evaluata intr-o maniera obiectiva, fiind inregistrate numarul de conflicte (agresiuni verbale) intr-o sarcina de lucru primita Concluzii in acest capitol au fost discutate principalele elemente necesare pentru a intelege dimensiunea cercetarii stiintifice in psihologie Cu toate ca sunt precizate aspecte specifice pentru metodologiile calitative, accentul este pus pe studiile care utilizeaza o metodologie cantitativa, acesta fiind curentul majoritar in domeniul psihologiei insa indiferent de tipul de cercetare avut in vedere, aprecierea calitatii acesteia nu se face luand in seama criterii cantitative superficiale, de genul numarului de ipoteze, a numarului de instrumente utilizate, a complexitatii analizelor statistice etc , ci de masura in care studiile respective sunt valide Validitatea unui studiu nu este determinata per se, ci are in vedere nuante diferite in functie de obiectivele sale si nici nu priveste studiul in ansamblul sau, ci se analizeaza la nivelul afirmatiilor (concluziilor) din studiu Astfel un rezultat statistic poate fi valid (validitate statistica), fara a fi insa adevarata relatia cauzala specificata intre variabilele studiate (validitate interna scazuta) La fel, un rezultat poate fi, atat valid statistic, cat si clar din perspectiva unei relatii cauzale, insa explicatia oferita pentru aceasta stare de fapt sa fie una gresita (validitate de construct scazuta) in sfarsit, chiar daca rezultatul este semnificativ statistic si indica o relatie cauzala bazata pe o explicatie corect identificata, este posibil ca efectul observat sa aiba un grad scazut de generalizare (transfer) in alte contexte (validitate externa scazuta) Asadar, in analiza validitatii trebuie urmarite toate cele patru forme ale sale, indeosebi pe acelea cu cel mai ridicat nivel de relevanta pentru un anumit tip de studiu in acest sens, studiile pot viza obiective exploratorii, obiective descriptive, obiective cauzale si obiective explicative (cauzal-explicative) in functie de obiectivul vizat de un anumit studiu pot fi deosebit de importante anumite tipuri de validitate: (a) de construct (pentru obiective exploratorii); de construct, externa si statistica (pentru obiective descriptive); interna (pentru obiectivele cauzale); interna si de construct (pentru obiective cauzal-explicative) in sfarsit, din perspectiva designului utilizat, studiile cu un nivel ridicat de rigurozitate, precum sunt experimentele, necesita o atentie deosebita aspectelor ce tin de validitatea interna si a celei de construct Cunoasterea in profunzime a aspectelor legate de validitatea unei cercetari este importanta nu numai din perspectiva critica, ci si pentru a identifica idei viitoare de cercetare in sfarsit, deoarece niciun studiu nu poate raspunde perfect tuturor riscurilor posibile pentru toate formele de validitate, se recomanda la nivelul unui studiu individual centrarea pe acele aspecte ale validitatii importante pentru a raspunde adecvat intrebarii studiului Numai programele de cercetare pe o anumita tema pot raspunde adecvat si in timp (pe rand), la fiecare dintre posibilele limite sesizate Pe baza mai multor asemenea programe de studii se poate ajunge la completarea unui ciclu intreg de studii cu referire la problematica investigata in cadrul capitolului am prezentat ciclul natural stiintific de abordare a unei probleme intr-o maniera pragmatica Acesta poate fi descris succint prin doua mari faze: (a) faza de cunoastere a problemei si (b) faza de solutionare a problemei Lecturi suplimentare Alan E Kazdin (2010) Research design in clinical psychology (editia a iV-a) Boston, USA: Allyn & Bacon Capitolele 2, 3 si 4 ale cartii trateaza pe larg problematica celor patru tipuri de validitate si a distorsiunilor legate de activitatea de cercetare in general Referinta este indeosebi utila celor interesati de domeniul clinic, prin ilustrarile pe care le contine, insa ideile si principiile enuntate sunt valabile pentru orice domeniu de cercetare psihologica William R Shadish, Thomas D Cook, Donald T Campbell (2002) Experimental and quasi-experimental designs for generalized causal inference Boston, USA: Houghton Mifflin Company Cartea reprezinta intr-o maniera actualizata informatiile prezentate in volumele clasice din domeniu cum ar fi Cook si Campbell (1979), tratand intr-o maniera extensiva problematica validitatii unei cercetari din perspectiva afirmatiilor pe care le incumba John Ж Creswell (2007) Qualitative inquiry & Research design Choosing among five approaches Londra, UK: Sage Publications Recomand aceasta lucrare pentru cei interesati sa isi dezvolte abilitatile de cercetare calitativa Pe parcursul lucrarii sunt prezentate pe larg cinci dintre cele mai cunoscute tipuri de cercetare calitativa: abordarea narativa (cum ar fi istoria orala), fenomenologia, cercetarile einografice, teoria generata (grounded theory) si studiul de caz intensiv Podsakoff, P M , MacKenzie, S M , Podsakoff, N P (2012) Sources of method bias in social science research and recommendation on how to control it Annual Review of Psychology, 63, pp 539-569 Articolul prezinta impactul pe care il exercita distosiunea metodei comune, probabil cea mai intalnita problema legata de validitatea de construct, asupra rezultatelor statistice obtinute, precum si o serie de masuri, menite sa reduca sau sa controleze nivelul acestei distorsiuni Bibliografie Aronson, E , Mills, J (1959) The effect of severity of initiation on liking for a group Journal of Abnormal and Social Psychology, 59, pp 177-181 Awa, W , Plaumann, M , Walter, U (2010) Burnout prevention: A review of intervention programs Patient Education and Counseling, 78, pp 184-190 Bedos C , Pluye P , Loignon, C , Levine, A (2008) Qualitative research in E Lesaffre, J Feine, B Leroux, D Declerck (eds ), Statistical and methodological aspects of oral health research (pp 113130) West Sussex, UK: John Wiley and Sons Bontila, G (1935) Tehnica testarii psihologice Bucuresti: Editura Cartea Romaneasca Brewer, M B (2000) Research design and issues of validity in H T Reis, C M Judd (eds ), Handbook of research methods in social and personality psychology (pp 3-16) New York: Cambridge University Press Campbell, D T , Stanley, J C (1963) Experimental and quasi-experimental designs for research on teaching in N L Gage (ed ), Handbook of research on teaching (pp 171-246) Chicago: Rand McNally Carroll, K M , Nich, C , Sifry, R L , Nuro, K F , Frankforter, T L , Ball, S A et al (2000) A general system for evaluating therapist adherence and competence in psychotherapy research in the addictions Drug and alcohol dependence, 57, pp 225-238 Cook, T D Campbell, D T (1979) Quasi-experimentation Design & analysis issues for field settings Chicago: Rand McNally Cordray, D S , Pion, G M (2006) Treatment strength and integrity: Models and methods in R R Bootzin, P E , McKnight (eds ), Strengthening research methodology: Psychological measurement and evaluation (pp 103-124) Washington, DC: American Psychological Association Creswell, J W (2007) Qualitative inquiry & Research Design Choosing among five approaches Londra: Sage Publications Creswell, J W (2006) Educational research: Planning, conducting, and evaluating quantitative and qualitative research (editia a iii-а) Upper Saddle River, NJ: Pearson David, D (2006) Metodologia cercetarii clinice Fundamente iasi: Editura Polirom David, D , Szentagotai, A , Lupu, V , Cosman, D (2008) Rational emotive behavior therapy, cognitive therapy, and medication in the treatment of major depressive disorder: A randomized clinical trial, post-treatment outcomes, and six-month follow-up Journal of Clinical Psychology, 64, pp 728-746 De Houwer, J (2007) A conceptual and theoretical analysis of evaluative conditioning The Spanish Journal of Psychology, 10, pp 230-241 Demerouti, E , Bakker, A B , Nachreiner, F , Schaufeli, W B (2001) The job demands-resources model of burnout Journal of Applied Psychology, 86, pp 499-512 Elliott, R , Timulak, L (2005) Descriptive and interpretative approaches to qualitative research in J Miles, P Gilber, (eds ), A Handbook of Research Methods for Clinical and Health Psychology (pp 147-160) Marea Britanie: Oxford University Press Elmes, D G , Kantowitz, B H , Roediger, H L (2012) Research methods in psychology (editia a iX-a) St Paul, MN: West Freudenberger, H J (1975) The staff burnout syndrome in alternative institutions Psychotherapy: Theory, Research and Practice, 12, pp 73-82 Gawronski, B , Payne, B K (eds ) (2010) Handbook of implicit social cognition: Measurement, theory, and applications New York: Guilford Press Gilbert, P , irons, C (2008) Thinking about research: issues and dilemmas in J Miles, P Gilber, (eds ), A Handbook of Research Methods for Clinical and Health Psychology (pp 1-14) Marea Britanie: Oxford University Press Goutas, L J (2008) Bournout The Write Stuff, 17, pp 135-138 Greenwald, A G , McGhee, D E , Schwartz, J L K (1998) Measuring individual differences in implicit cognition: The implicit Association Test Journal of Personality and Social Psychology, 74, pp 1464-1480 Heppner, P P , Wampold, B E , Kivlighan, D M , Jr (2008) Research design in counseling (editia a iii-a) Belmont, CA: Thomson Brooks Cole Howitt, D , Cramer, D (2000) First steps in research and statistics: A practical workbook for psychology students Londra: Routledge Kantowitz, B H , Roediger, H L , iii, Elmes, D G (2009) Experimental Psychology Cheriton House, UK:Cengage Learning Kaschka, W P , Korczak, D , Broich, K (2011) Burnout: a fashionable diagnosis Deutsches Arzteblatt, 108, pp 781-787 doi:10 3238 arztebl 2011 0781 Kazdin, A E (2010) Single-case Research Designs: Methods for Clinical and Applied Settings (editia a ii-a) New York: Oxford University Press Kerlinger, F N , Lee, H B (2000) Foundations of behavioral research (editia a iV-a) Holt, NY: Harcourt College Publishers Kraemer, H C (2000) Pitfalls of multisite randomized clinical trials of efficacy and effectiveness Schizophrenia Bulletin, 26, pp 533-541 Laverty, S M (2003) Hermeneutic phenomenology and phenomenology: A comparison of historical and methodological considerations international Journal of Qualitative Methods, 2(3) Gasit la adresa http:  www ualberta ca  iiqm backissues 2 3final pdf laverty pdf Leiter, M P , Maslach, C (2005) Banishing burnout: Six strategies for improving your relationship with work San Francisco, CA: Jossey-Bass LeLorier, J , Gregoire, G , Benhaddad, A , Lapierre, J , Derderian, F (1997) Discrepancies between metaanalyses and subsequent large randomized, controlled trials The New England Journal of Medicine, 337, pp 536-542 doi:10 1056 NEJM199708213370806 Maslach, C (1976) Burned-out Human Behavior, 9, pp 16-22 Maslach, C (1981) Burnout: A social psychological analysis in J W Jones (ed ), The burnout syndrome (pp 30-53) Park Ridge, iL: London House Maslach, C , Leiter, M P (1997) The truth about burnout San Francisco, CA: Jossey-Bass Maslach, C , Schaufeli, W B , Leiter, M P (2001) Job burnout Annual Review of Psychology, 52, pp 397-422 doi:10 1146 annurev psych 52 1 397 Maxwell, J A (1992) Understanding and validity in qualitative research Harvard Educational Review, 62, pp 279-301 Olantunji, B O , Lohr, J M , Sawchuk, C N , Westendorf, D H (2005) Using facial expressions as CSs and fearsome and disgusting pictures as UCSs: affective responding and evaluative learning of fear and disgust in blood-injection-injury phobia Journal of Anxiety Disorders, 19, pp 539-555 Pelham, B W , Blanton, H (2007) Conducting research in psychology: Measuring the weight of smoke (editia a ili-a) Belmont, CA: Wadsworth Thomson Podsakoff, P M , MacKenzie, S M , Lee, J , Podsakoff, N P (2003) Common method variance in behavioral research: A critical review of the literature and recommended remedies Journal of Applied Psychology, 88, pp 879-903 Podsakoff, P M , MacKenzie, S M , Podsakoff, N P (2012) Sources of method bias in social science research and recommendation on how to control it Annual Review of Psychology, 63, pp 539-569 Raudenbush, S W , Liu, X (2000) Statistical power and optimal design for multisite randomized trials Psychological Methods, 5, pp 199-213 Sava, F (2004 2011) Analiza datelor in cercetarea psihologica Metode statistice complementare Cluj-Napoca: ASCR Sava, F A (ed ) (2011) Metode implicite de investigare a personalitatii iasi: Editura Polirom Schaufeli, W B (2003) Past performance and future perspectives of burnout research South African Journal of industrial Psychology, 29, 1-15 Schaufeli, W B , Leiter, M P , Maslach, C (2009) Burnout: 35 years of research and practice Career Development international, 14, pp 204-220 doi:10 1108 13620430910966406 Scifres, C M , iams, J D , Klebanoff, M , Macones, G A (2009) Metaanalysis vs large clinical trials: which should guide our management? American Journal of Obstetrics & Gynecology, 5, p 484 Shadish, W R , Cook, T D , Campbell, D T (2002) Experimental and quasi-experimental designs for generalized causal inference Boston: Houghton Mifflin Singera, R A , Zentall, T R (2011) Preference for the outcome that follows a relative aversive event: Contrast or delay reduction? Learning and Motivation, 42, pp 255-271 Susser, E , Schwartz, S , Morabia, A , Bromet, E (2006) Psychiatric epidemiology: Searching for the causes of mental disorders New Zealand: Oxford University Press Steckler, A , McLeroy, K R , Goodman, R M , Bird, S T , McCormick, L (1992) Toward integrating qualitative and quantitative methods: An introduction Health Education Quarterly, 19, pp 1-8 Sweldens, S , van Osselaer, S M J , Janiszewski, C (2010) Evaluative conditioning procedures and the resilience of conditioned brand attitudes Journal of Consumer Research, 37, pp 473-489 doi: 10 1086 653656 Tashakkori, A , Teddlie, C (1998) Mixed methodology: Combining gualitative and guantitative approaches (Applied Social Research Methods, Nr 46) Thousand Oaks, CA: Sage Turok, K D , Espez, E , Edelman, A B , Lotke, P S , Lathrop, E H , Teal, S B , Jacobson, J C , Simonsen, S E , Schulz, K F (2011) The methodology for developing a prospective metaanalysis in the family planning community Trials, 12, p 104 doi:10 1186 1745-6215-12-104 Trochim, W M (2006) The Research Methods Knowledge Base (editia a П-a) Gasit la 10 08 2012 la adresa http:  www socialresearchmethods net kb index php van der Klink, J J, Blonk, R W , Schene, A H , van Dijk, F J (2001) The benefits of interventions for work-related stress American Journal of Public Health, 91, pp 270-276 Whittemore, R , Chase, S K , Mandle, C L (2001) Validity in qualitative research Qualitative Health Research, 11, pp 522-537 Wikipedia (2012) Effort justification Gasit la data de 05 05 2012 la adresa: http:  en wikipedia org wiki  Effortjustification in tarile dezvoltate, orice proiect de cercetare poate fi implementat doar dupa ce primeste aprobarea din partea unei comisii de etica a cercetarii (iRB - institutional Review Board) O asemenea practica a inceput sa fie implementata recent si la noi, vezi cazul Universitatii "Babes-Bolyai" din Cluj-Napoca in plus, pentru a putea derula cercetari pe subiecti umani, unele institutii solicita cercetatorilor sa obtina sa faca dovada existentei unui certificat de absolvire cu succes a unui curs despre protejarea participantilor la cercetare Un exemplu de astfel de curs in limba engleza, ce poate fi urmat gratuit de oricine, este disponibil la http:  phrp nihtraining com users overview php in acest sens, in special in domeniul stiintelor medicale se vorbeste tot mai des despre cercetarea translationala ca un tip de cercetare liant intre cea fundamentala si cea aplicata, avand rolul de a grabi transferul rezultatelor obtinute in cercetarea fundamentala (de exemplu, anumite descoperiri din biologia moleculara) in zona clinica (a studiilor randomizate), precum si de a asigura feedbackul invers, astfel incat anumite probleme stringente in zona clinica sa determine agenda cercetarii din zona fundamentala Acest tip de cercetare necesita expertiza avansata si o abordare interdisciplinara Pentru a ilustra si mai clar consecintele aplicarii unei metodologii inadecvate vom apela la exemplul oferit de David (2006) cu privire la Mos Craciun Astfel, dintr-o cercetare efectuata in paradigma hermeneutica cu privire la portretul psihologic al lui Mos Craciun la copiii de 4-5 ani am concluziona corect (fiind vorba de credintele lor) ca: (a) exista probe despre existenta lui Mos Craciun; (b) daca il vom imbuna, fiind cuminti, vom primi mai multe cadouri Cu alte cuvinte, rezultatele studiului nu arata ca asa stau lucrurile (ca Mos Craciun exista), ci ca copiii cred ca Mos Craciun exista Printr-un demers pozitivist, am afla insa ca Mos Craciun nu exista (ce realitate dura!) Acest exemplu poate parea ilar, pentru ca toti cititorii acestei carti cunosc aceasta diferenta, insa daca ne referim la aspecte psihologice complexe supuse cercetarii, vom observa cazuri in care cercetatorii confunda realitatea observata cu realitatea construita (luand credintele participantilor drept adevaruri pentru a sustine, de pilda, ca plecarea parintilor la munca in strainatate cauzeaza tulburari emotionale copiilor ramasi acasa) Pericolul acestui tip de confuzie este cu atat mai mare, cu cat credintele impartasite de participanti par a fi unele rezonabile logic (de exemplu, ca programele educationale cu privire la conduita in trafic adresate adolescentilor vor reduce numarul accidentelor in care sunt implicati, afirmatie nesustinuta empiric - vezi exemplul al doilea din caseta 2 1, capitolul 2) Cu toate acestea, cercetarea credintelor (a realitatii construite) este la fel de onorabila si utila precum demersurile de tip pozitivist Astfel, pentru activitatea unui consilier scolar ar fi foarte important sa se cunoasca modul in care adolescentii din familii cu parinti aflati la munca in strainatate, percep si traiesc aceasta stare de fapt, respectiv modul in care tinerii se raporteaza la programele de educatie rutiera, pentru a le putea imbunatati Distinctiile prezentate in acest tabel au fost facute in scop pedagogic, pentru a sublinia unele diferente intre cele doua abordari in realitate intre cele doua viziuni exista mai degraba diferente de nuanta De exemplu, abordarea pozitivista nu sustine ca nu exista cunoastere (realitate) subiectiva, ci doar ca analiza acesteia duce la studierea unei realitati percepute, nu a realitatii obiective Exista o distinctie clara intre conceptele de metodologie a cercetarii, designul cercetarii si metodele de cercetare, relatia dintre ele fiind una ierarhica in functie de metodologia aleasa (de exemplu, o metodologie cantitativa in paradigma pozitivista), se apeleaza la un anumit design de cercetare (de exemplu, unul de tip descriptiv, non-experimental, sub forma unui sondaj de opinie), care, la randul sau, presupune utilizarea unor metode de cercetare adecvate (de exemplu, metoda chestionarului) Astfel, Creswell (2006) sintetizeaza distinctia conceptuala dintre cele trei Prin metodologia cercetarii se stabilesc liniile mari prin care se va derula o cercetare ca urmare a unei optiuni filosofice pentru o paradigma de cercetare (un mod de a ne raporta si intelege lumea si de a acumula cunoastere stiintifica, fiind lentilele care ne directioneaza spre ce anume privim in lume) Prin designul cercetarii se stabileste un plan de actiune prin care se incearca sa fie valorificate metodele de cercetare pentru a atinge obiectivele studiului, fiind astfel un nivel intermediar de raportare intre aspectele filosofice (din sfera metodologiei cercetarii) si aspectele tehnice (din sfera metodelor de cercetare) Prin metode de cercetare ne referim la tehnici specifice de colectare a datelor, cu implicatii la nivelul analizei datelor (interviu, observatie participativa, teste psihologice etc ) Desi interrelationate, nu exista o echivalenta intre obiectivele descriptive si metodele de cercetare utilizate De exemplu, sondajele de opinie pot viza aspecte analitice, in timp ce studiul bazat pe observatii poate viza obiective de tip exploratoriu in mod similar, studiile de caz (mentionate ca studii exploratorii) pot viza obiective descriptive De exemplu, in studiile experimentale intotdeauna manipularea Vi preceda masurarea efectelor la nivel de VD cauzate de aceasta manipulare De asemenea, in studiile non-experimentale longitudinale, se pot evidentia legaturi intre factorul cauzal potential masurat la momentul TO si consecintele asupra variabilei efect la momentul Ti in unele cazuri, legatura statistica dintre variabile poate fi unidirectionala din punct de vedere logic Un exemplu ar fi asocierea dintre temperatura ambientala ridicata si un nivel crescut de ostilitate (iritabilitate) Ar fi dificil logic sa gandim ca pe masura ce oamenii devin mai iritati creste temperatura mediului ambient, in schimb ar fi logic plauzibil sa afirmam ca pe masura ce creste temperatura din mediul ambient oamenii devin mai iritati (ostili) Pe langa riscul in sine, constituie pericole la adresa validitatii interne a unui studiu si interactiunile dintre distorsiunea de selectie si alte riscuri (de exemplu, distorsiunea de selectie x istoric; distorsiunea de selectie x maturare etc ) De exemplu, este posibil ca persoanele incluse in grupul experimental sa fie mai preocupate de aspectul durerii si sa caute sa se informeze in legatura cu tehnici psihologice de reducere a durerii in acest caz ipotetic, cele doua grupe vor diferi nu numai in ceea ce priveste deprinderea tehnicii Lamaze, ci si in privinta nivelului de cunoastere a altor tehnici (recomandari psihologice) menite sa reduca durerea Desigur, ideal ar fi sa se tinda catre standardul maxim aplicabil in domeniul stiintelor medicale, indeosebi al farmacoterapiei, in care studiul experimental cu grup de control activ (interventie standard) se deruleaza in conditii lipsite de transparenta (cum ar fi designul triplu orb, in care nici participantii la studiu, nici cei care pun la dispozitia participantilor medicatia analizata in studiu si nici asistentii de cercetare care evalueaza efectele obtinute nu stiu carei conditii experimentale ii apartine cel evaluat) intr-un astfel de design sunt controlate eficient toate riscurile posibile privitoare la validitatea interna a studiului Din pacate, in cazul interventiilor psihologice este imposibil de implementat un asemenea studiu, cel putin cu privire la situatia celor care livreaza interventia Totusi, pot fi luate masuri in directia reducerii transparentei obiectivului studiului, fie prin aplicarea individuala, fie prin combinarea unor masuri precum: (a) necomunicarea ipotezei urmarite celor care livreaza, respectiv primesc interventia; (b) utilizarea unor asistenti de cercetare pentru colectarea masuratorilor de tip pretest, interim sau posttest care sa nu cunoasca nici carei conditii experimentale ii apartine cel examinat si sau nici care ar fi ipoteza studiului; (c) utilizarea unor interventii nespecifice, credibile pentru participantii la studiu, pentru a decela efectul placebo de efectul real al interventiei Pelham si Blanton (2007) mentioneaza o alta distinctie posibila intre validitatea de construct si validitatea conceptuala Prima vizeaza mai degraba legatura dintre concept (construct) si modul de operationalizare al sau in cadrul unui studiu (de exemplu, reprezinta seria de desene Ben 10 o modalitate adecvata de operationalizare pentru conceptul de desene animate agresive?) in schimb, validitatea conceptuala are un sens mult mai larg si se refera la masura in care intregul concept studiat poate fi explicat din perspectiva unei teorii, la masura in care un intreg set de studii (program de studii) sprijina sau nu o anumita teorie, utilitatea unui anumit concept nou Un alt posibil risc clasic, rar intalnit la nivelul studiilor publicate in reviste cu prestigiu international, este cel al definirii inadecvate a conceptului studiat, cu consecinte negative asupra operationalizarii acestuia in schimb, mai frecvent pot aparea probleme de etichetare a constructului studiat De exemplu, intr-un studiu despre relatia dintre agresivitate si consumul de filme video violente se pot intelege prin agresivitate (inclusiv la nivel de operationalizare) numai aspecte ce se refera la agresivitatea fizica, fara a socoti alte fatete ale agresivitatii precum agresivitatea verbala sau atitudinea ostila pasiv-agresiva Reactivitatea participantilor este trecuta clasic ca un risc privitor la validitatea de construct (Shadish et al , 2002; Cook si Campbell, 1979; Kazdin, 2010) De exemplu, atunci cand obtinem un rezultat semnificativ statistic si vrem sa explicam rezultatul (scop cauzal-explicativ), nu am sti daca efectul este cauzat de interventie (manipulare experimentala) sau este o consecinta a reactivitatii participantilor in sens utilitar insa ("este interventia eficienta?" "exista o relatie cauza-efect?"), reactivitatea participantilor constituie un risc la nivelul validitatii interne, fiind un artefact ce creste probabilitatea aparitiei unei erori de tip i De exemplu, interventia poate sa nu fie eficienta in realitate, dar rezultatul obtinut sa fie unul semnificativ statistic, din cauza reactivitatii participantilor Un ghid succint, dar foarte util despre debriefing gasiti la: http:  www wadsworth com psychology d templates student resources workshops res methd debrief de Brewer (2000) semnaleaza ca, intr-un studiu bazat pe amenintarea stimei de sine prin oferirea unui feedback negativ participantilor pentru un eseu scris, in conditii controlate de laborator, sarcina are un realism psihologic mai ridicat pentru subiecti daca acestia sunt studenti decat pentru mineri cu varsta de peste 50 de ani Cel mai cunoscut cost de acest gen priveste relatia dintre validitatea interna si cea externa Pe masura ce exista mai multa preocupare fata de controlul variabilelor confundate pentru a creste validitatea interna, creste totodata nivelul de artificialitate al cercetarii, scazand astfel validitatea externa O alta relatie inversa poate fi sesizata intre validitatea de construct si cea interna De exemplu, pentru a evita distorsiuni precum subreprezentarea constructelor sau distorsiunea monometoda, cercetatorul poate apela la masuri multiple de evaluare a efectului masurat Acest efect creste insa timpul de examinare si intensifica efortul participantilor in cadrul studiului, fapt care poate conduce la cresterea procentului de participanti care renunta la studiu, cu consecinte negative asupra validitatii interne (diferentele dintre grupe sunt cauzate de retragerea diferentiata din studiu) si a celei externe (prin scaderea reprezentativitatii participantilor ramasi in studiu pentru populatia generala) Cititorii interesati de acest aspect al validitatii studiilor calitative pot gasi mai multe detalii, inclusiv despre aspecte specifice ale validitatii pentru diferite tipuri de studii (abordari fenomenologice, abordari narative etc ) in Creswell (2007) Un asemenea ciclu de abordare stiintifica a unei probleme poate fi un instrument euristic util in a identifica punctele nevralgice ale unui domeniu de cercetare in cazul specific al burnoutului, existenta deopotriva a unor interventii specifice, precum si a celor general valabile pentru imbunatatirea starii de sanatate mentala poate fi interpretat ca o consecinta directa a presiunii venite din lumea practicienilor de a oferi solutii la probleme in contextul in care nu exista studii elocvente cu privire la ingredientele active (mecanismele cauzale) responsabile pentru reducerea nivelului de burnout Ca urmare a acestei stari de fapt, in care balanta dintre cercetare fundamentala vs cercetare aplicativa inclina evident in favoarea ultimei, se impune sprijinirea mai multor cercetari fundamentale Din acest punct de vedere, ar fi nevoie indeosebi de o focalizare mai mare asupra obtinerii de dovezi empirice asupra modelelor teoretice dezvoltate pentru a explica burnoutul si a identificarii acelor mecanisme cauzale responsabile pentru prevenirea si sau combaterea acestui fenomen nedorit, dar prezent in organizatiile contemporane Numai in acest fel vom putea sa ne asiguram ca avem de-a face cu o abordare pragmatica, validata stiintific, iar practicienii nu vor mai putea fi acuzati ca pun caruta inaintea cailor, cu alte cuvinte ca ofera solutii pentru o problema al carei model teoretic este inca insuficient fundamentat empiric Partea a doua Tipuri majore de studii in cercetarea psihologica Capitolul 4 Studiile experimentale 4 1 Experimentul - metoda regala in cercetarea stiintifica La cele mai multe dintre problemele mentionate pe parcursul primelor doua capitole ale acestei lucrari, raspunsurile pot fi oferite prin apel la studii experimentale Spre exemplu, putem analiza credinta populara conform careia ascultarea muzicii clasice compusa de Mozart are efecte benefice asupra dezvoltarii intelectuale la copii Mai specific, se considera ca ascultarea repetata a acestui tip de compozitii conduce la potentarea nivelului de inteligenta al copiilor care sunt expusi in mod repetat la aceasta stimulare Studiile non-experimentale, cum ar fi cele de tip corelational, nu sunt suficiente pentru a putea sustine stiintific o asemenea concluzie, deoarece este posibil ca simpla corelatie dintre ascultarea muzicii lui Mozart si coeficientul de inteligenta a copiilor sa fie doar un artefact statistic in spatele ascultarii muzicii lui Mozart s-ar putea regasi situatia unor familii cu un capital cultural bogat, fapt care faciliteaza dezvoltarea cognitiva a copilului Singura metoda stiintifica prin care se poate demonstra existenta sau inexistenta efectului Mozart (si, in general, eficienta oricarui tip de interventie tratament) este metoda experimentala Caseta 4 1 Descrierea dovezilor stiintifice legate de efectul Mozart Rauscher, Shaw si Ky (1993) au publicat rezultatele unui experiment in prestigioasa revista Nature, prin care se sustinea ideea ca muzica lui Mozart conduce la cresterea tranzitorie a performantei in sarcini specifice pentru a surprinde inteligenta spatiala in sprijinul acestei concluzii, autorii au prezentat rezultatele unui experiment in cadrul caruia au existat trei grupe de participanti: cei care au ascultat timp de 10 minute muzica lui Mozart (mai exact sonata pentru doua piane K448), cei care au beneficiat timp de 10 minute de un instructaj specific tehnicilor de relaxare si cei din conditia neutra, care au stat timp de 10 minute in conditii de liniste deplina Dupa manipularea variabilei de interes (asculta sau nu muzica lui Mozart) si controlul variabilelor potential confundate (prin distribuirea randomizata a participantilor in cele trei grupe experimentale) cercetatorii au evaluat efectul muzicii prin masurarea performantei participantilor in rezolvarea unor sarcini spatiale din cadrul unui test de inteligenta (componenta de inteligenta spatiala) Rezultatele obtinute au uimit lumea stiintifica prin faptul ca cei care au fost inclusi in grupul celor care au ascultat muzica lui Mozart au obtinut performante semnificativ statistic mai bune in sarcinile spatiale decat cei din celelalte doua grupe experimentale, diferenta fiind de aproximativ 8-9 puncte in termeni de iQ, insa efectul erau unul tranzitoriu (se mentinea timp de 10-15 minute de la finalizarea expunerii la muzica) Studiile ulterioare au confirmat doar partial aceste rezultate in sensul ca cea mai recenta si comprehensiva metaanaliza pe aceasta tema, efectuata de Pietschnig, Voracek si Formann (2010), indica un efect de intensitate moderata spre scazuta (d Cohen egal cu 0,37) a muzicii lui Mozart comparativ cu performanta obtinuta de cei care asteptau in liniste (grupul de control), un efect similar fiind insa intalnit si daca erau comparate alte compozitii muzicale cu performantele celor din grupul de control Daca se compara muzica lui Mozart cu alte genuri muzicale, diferenta era una neglijabila Mai mult efectele observate sunt intr-adevar tranzitorii, sunt obtinute doar la nivelul componentei spatiale a iQ si se bazeaza indeosebi pe studii facute pe populatie adulta Aceste rezultate nu au afectat insa dezvoltarea unei adevarate industrii de promovare a efectului Mozart pentru copii, sustinuta de dorinta parintilor de a augmenta nivelul intelectual al copiilor De exemplu, celebrul site Amazon com continea in 2008 peste 40 de produse (CD-uri) care sustineau ca sunt eficiente in producerea efectului Mozart, iar unele state americane au mers pana intr-acolo incat au votat un proiect de lege care cerea creselor de stat sa puna, in fiecare zi, muzica clasica sugarilor (Florida) sau au creat subventii din bugetul statului astfel incat fiecare copil nou-nascut sa primeasca gratuit un CD cu muzica lui Mozart (Georgia si Tennessee) (Lilienfeld etal , 2010) Orice experiment presupune: (a) manipularea variabilei independente pentru a vedea efectele acestei actiuni asupra variabilei dependente; (b) controlul variabilelor potential confundate in designuri intergrup prin alocarea randomizata a participantilor in grupele experimentale Cand se vorbeste despre ideea de control in cadrul unui experiment, se pot avea in vedere cel putin trei niveluri diferite de analiza (Elmes, Kantowitz si Roediger iii, 2012): (a) nivelul comparativ (prin compararea performantei grupului experimental cu cea a unui grup de control); (b) nivelul manipularii variabilei independente (Vi) (control exercitat prin posibilitatea de a modifica nivelul intensitatii Vl tipul de interventie oferita participantilor la studiu); (c) controlul variabilelor straine (potential confundate) care ar putea afecta relatia de tip cauza-efect studiata (de exemplu, control exercitat prin alocarea randomizata a participantilor in grupul experimental, respectiv in cel de control) Prin manipularea variabilei independente (cauza) in cadrul unui experiment, cercetatorul exercita un control asupra a ceea ce ofera indivizilor (input), pentru a observa daca apar modificari in realitate cu privire la efectul studiat (output) De exemplu, se poate urmari daca performanta indivizilor la sarcini vizual-spatiale se modifica in contextul in care variabila-cauza este activa (se asculta muzica de Mozart) sau inactiva (participantii asteapta in liniste) in plus, poate fi testat aspectul de specificitate (doar muzica lui Mozart, orice tip de muzica clasica sau muzica, in general, produce aceste efecte) De asemenea, prin alocarea randomizata a participantilor in grupele experimentale, cercetatorul exercita un control asupra variabilelor potential confundate ce pot afecta rezultatele studiului Este vorba de controlul acelor variabile care pot influenta efectul urmarit - performanta la sarcini spatiale Acest control se obtine prin egalizarea starii de fapt existente in grupele experimentale cu referire la variabile precum atitudinea fata de muzica clasica, dispozitia afectiva, nivelul de cultura al participantilor, nivelul iQ-ului lor general etc , aspect obtinut prin alocarea randomizata a participantilor in grupele experimentale Data fiind relevanta definitorie pentru orice studiu experimental a conceptului de relatie cauza-efect, precum si a mijloacelor utilizate pentru atingerea acestui scop - manipularea variabilei cauza (independente), respectiv controlul variabilelor straine, vom prezenta, in cele ce urmeaza, fiecare dintre aceste concepte fundamentale pentru studiile experimentale 4 1 1 Despre relatia cauza-efect in psihologie De obicei, cei mai multi dintre noi avem o predilectie de a gandi in termenii unei relatii de tip cauza-efect Ne-am imbolnavit pentru ca organismul nostru era slabit ca urmare a lipsei de odihna, avem probleme de somn pentru ca suntem prea stresati, am promovat un examen dificil ca urmare a efortului depus de a invata la disciplina respectiva, copilul vecinului este neastamparat pentru ca parintii acestuia nu se ocupa suficient de educatia lui etc De multe ori, acest tip de argumentare este considerata a fi suficienta in gandirea uzuala pentru a concluziona asupra cauzelor respective ca sunt suficiente pentru aparitia unui anumit eveniment intr-o abordare stiintifica, relatia de tip cauza-efect este una mult mai complexa, pornind inclusiv de la faptul ca variabila-cauza poate avea o alta semnificatie decat aceea a unei conditii necesare si suficiente pentru a produce un anumit fenomen Pentru a explica ideea cauzalitatii in stiinta, vom apela la exemplul oferit de Shadish, Cook si Campbell (2002) cu privire la cauzele aparitiei unui incendiu intr-o padure Un incendiu poate avea cauze multiple, cum ar fi un chibrit aprins aruncat in iarba, un foc de tabara nesupravegheat, un fulger etc Niciuna dintre aceste posibile cauze nu este necesara (de exemplu, un incendiu poate aparea si in situatii in care nu este vorba despre un foc de tabara), nici suficienta (de exemplu, un foc de tabara nesupravegheat, pentru a se transforma in incendiu, ar trebui sa fie insotit de o serie de conditii favorabile explicite, cum ar fi prezenta unor lemne sau frunze uscate, sau implicite, cum ar fi prezenta oxigenului pentru combustie) Astfel cauza potentiala (chibritul aprins aruncat in iarba, focul de tabara nesupravegheat, fulgerul etc ) face parte dintr-o constelatie de factori necesari pentru aparitia efectului - incendierea padurii Din acest punct de vedere, aceste cauze potentiale au fost denumite conditii "inus" de catre Mackie (1974 apud Shadish et al , 2002), adica o conditie insuficienta, neredundanta, ca parte a unei conditii nenecesare, dar suficiente Sa ilustram aceste cuvinte abstracte prin exemplul incendierii padurii Lasarea nesupravegheata a unui foc de tabara aprins reprezinta o conditie insuficienta pentru a porni un incendiu, in absenta altor factori favorizatori, dar este o actiune neredundanta, contribuind intr-o maniera unica la explicarea unei parti insemnate dintre incendiile declansate de-a lungul timpului, alaturi de alte cauze potentiale posibile Totusi, lasarea nesupravegheata a focului de tabara poate fi privita ca parte a unui intreg (alaturi de existenta de lemne si frunze uscate, absenta ploii etc ) ce reprezinta o conditie suficienta pentru pornirea incendiului, dar nu si necesara, deoarece pot exista si alti factori responsabili pentru aparitia incendiului O denumire alternativa pentru aceasta perspectiva despre cauzalitate este oferita de Riegelman (1979), prin conceptul de conditie contributiva Din acest punct de vedere, o cauza poate fi contributiva daca modificarea variabilei-cauza afecteaza variabila-efect, cu precizarea ca nu intotdeauna o modificare a variabilei-cauza se soldeaza cu modificari ale variabilei-efect, la fel cum nici orice caz protejat de actiunea variabilei-cauza nu este scutit de aparitia efectului De aceea, in psihologie majoritatea relatiilor de tip cauza-efect nu descriu relatii deterministe (in care variabila-cauza este necesara si suficienta pentru a produce un anumit efect), ci se refera la relatiile de tip cauza-efect ca la niste conditii contributive, pe care evaluarile sistematice bazate pe metaanaliza (vezi capitolul 7) incearca sa le desluseasca, subliniind variabilele de tip mediator sau moderator care descriu dinamica relatiei dintre variabilele de tip cauza si cele de tip efect De asemenea, o alta distinctie utila pentru domeniul psihologiei este aceea de a diferentia intre relatiile cauzale cu rol descriptiv si relatiile cauzale cu rol explicativ (Shadish et al , 2002) Dintre cele doua, mult mai usor de demonstrat sunt relatiile cauzale de tip descriptiv, cum ar fi evidentierea faptului ca muzica lui Mozart poate fi eficienta in imbunatatirea performantelor la probe cognitive spatiale Pentru acest lucru este suficient sa realizam un studiu experimental care sa compare nivelul performantei la sarcini spatiale al celor din grupul care a beneficiat doua ore de muzica lui Mozart cu cel al indivizilor inclusi intr-un grup placebo, care a beneficiat de muzica clasica a altor compozitori, dar prezentata ca fiind muzica lui Mozart Cu alte cuvinte, este suficient sa demonstram ca variatii ale variabilei independente (cauza) efectuate intr-un context controlat, precum cel specific studiilor experimentale, produc modificari la nivelul efectului urmarit in directia asteptata in schimb, mult mai dificil de demonstrat este cazul unei relatii cauzale de tip explicativ, in care se incearca sa se stabileasca motivul pentru care relatia cauzala este una functionala Astfel, daca intr-o relatie cauzala descriptiva obiectivul fundamental este acela de a verifica daca exista o relatie de tip cauza-efect, intr-o relatie cauzala explicativa obiectivul fundamental devine acela de a identifica motivele care stau in spatele relatiei cauzale (care anume dintre caracteristicile asociate muzicii lui Mozart constituie elementul activ, responsabil pentru imbunatatirea performantei la sarcini spatiale - o crestere a capacitatii de atentie concentrata asupra sarcinii de rezolvat; o crestere a activitatii corticale pentru ariile cerebrale responsabile pentru procesarea informatiilor spatiale; inducerea unei dispozitii afective pozitive care descarca sistemul cognitiv de alocarea unor resurse spre directii nerelevante cum ar fi cazul anxietatii de performanta etc ) Detalii despre distinctia dintre studiile cu obiective cauzal-descriptive si cele cu obiective cauzal-explicative au fost oferite in capitolul anterior (sectiunea 3 3 5) 4 1 2 Controlul prin manipularea variabilei independente Prin manipularea variabilei independente (Vi), se intelege decizia cercetatorului de a varia nivelul variabilei-cauza pentru a observa efectele aparute pornind de la premisele bazale conform carora pentru a putea vorbi despre o relatie de tip cauza-efect trebuie sa observam ca: (a) modificarile la nivelul Vi se soldeaza cu modificari la nivelul variabilei dependente (VD); (b) modificarile la nivelul Vi le preceda pe cele aparute la nivelul VD De pilda, un cercetator interesat sa evidentieze relatia dintre consumul de calorii si greutatea corporala poate decide sa varieze consumul de calorii (de exemplu, grupul experimental sa consume jumatate din numarul de calorii consumat de grupul de control) Un cercetator care doreste sa compare eficienta a doua tipuri de psihoterapie, cognitiv-comportamentala vs familial-sistemica, in combaterea depresiei majore va decide sa varieze tipul de psihoterapie urmata de catre participantii la studiu, astfel incat unii dintre acestia sa urmeze sedinte de terapie cognitiv-comportamentala, iar altii sedinte de terapie familial-sistemica Se observa, asadar, interventia activa a cercetatorului, care poate decide care vor fi aspectele supuse manipularii De exemplu, chiar in contextul in care participantii sunt supusi aceluiasi tip de stimuli, manipularea poate avea in vedere instructajul oferit, timpul avut la dispozitie pentru rezolvarea sarcinii, nivelul beneficiilor oferite participantilor la studiu etc important din acest punct de vedere este sa fie manipulat, pe rand, cate un singur element diferentiator per grup experimental Daca se incalca acest principiu, interpretarea rezultatelor are de suferit, deoarece ajungem sa vorbim despre variabile confundate De exemplu, daca se compara eficienta terapiei cognitiv-comportamentale (TCC) aplicata individual cu terapia psihodinamica (P) de grup pentru a ameliora anxietatea sociala, nu vom putea interpreta acurat rezultatele cu privire la care dintre cele doua forme de psihoterapie ar fi mai eficienta, deoarece este posibil ca diferentele la nivel de efect sesizate sa fie cauzate de celalalt factor distinctiv dintre grupe - modalitatea de implementare: individuala, respectiv in grup Solutia pentru asemenea situatii, in care se doreste manipularea a mai mult decat o singura dimensiune, presupune trecerea de la un plan de baza unifactorial la planuri multifactoriale De exemplu, intr-un plan bifactorial (contine doua variabile independente) se poate raspunde adecvat la mai multe intrebari precum: (a) "care forma de psihoterapie urmata (TCC vs P) este mai eficienta?"; (b) "care modalitate de implementare (individual vs de grup) este mai eficienta?"; (c) "exista un efect de interactiune intre acesti factori care sa ne ajute la interpretarea nuantata a efectului - reducerea nivelului de anxietate sociala" Figura 4 1 Designuri experimentale de baza (stanga) si factoriale (dreapta) Aceste designuri factoriale pot fi obtinute nu numai prin incrucisarea a doua sau mai multe Vi manipulate de catre cercetator (de exemplu, tipul de muzica audiata si durata auditiei) (completely randomized design), ci si prin intersectarea unei variabile manipulate experimental (de exemplu, tipul de muzica ascultata) cu o variabila de tip eticheta, ce descrie diferente existente in mod natural intre participanti (cum ar fi sexul participantilor: barbati vs femei) (blocked randomized design) in sfarsit, manipularea Vi se poate face in doua feluri majore: prin apelul la un design de tip intergrup (between-subjects design), respectiv prin apelul la un design de tip intragrup, de tipul masuratorilor repetate (within-subjects design) in cazul designului de tip intergrup fiecare participant trece printr-o singura conditie experimentala (unii asculta muzica de Mozart, altii asteapta in liniste etc ), astfel incat fiecare participant este testat o singura data Situatia opusa este reprezentata de designul intragrup in care fiecare participant trece prin toate conditiile experimentale, performantele sale fiind masurate in mod repetat De exemplu, daca ar fi sa ne raportam la designul de baza prezentat in partea stanga a figurii 4 1, aceeasi participanti vor fi testati dupa fiecare situatie in care sunt supusi: ascultand muzica de Mozart, ascultand muzica unui alt compozitor, dar prezentata ca fiind a lui Mozart, respectiv asteptand in liniste Desigur, in cazul unor designuri de tip factorial (adica a prezentei a cel putin doua Vi), se pot intalni si situatii mixte (design mixt), daca una dintre variabilele independente este manipulata intergrup, iar cealalta variabila independenta este manipulata intr-o maniera de tip intragrup 4 1 2 1 Probleme uzuale legate de manipularea Vi prin designuri de tip intragrup Dintre tipurile de design amintite mult mai raspandite sunt cele de tip intergrup, in ciuda faptului ca necesita un numar mult mai mare de participanti decat designurile de tip intragrup Acest lucru este cauzat de unele neajunsuri asociate manipularii variabilelor independente intr-un design cu masuratori repetate, aspecte descrise in tabelul de mai jos Tabelul 4 1 Riscuri privitoare la validitatea interna a rezultatelor in experimente cu un design intragrup (adaptare dupa Pelham si Blanton, 2007) Denumire Descrierea problemei Solutii existente Repurtarea efectului (efectul de ordine) Efectul apare atunci cand raspunsul la stimulul anterior influenteaza raspunsul la stimulul urmator, fara a se dori explicit acest lucru Un exemplu de efect de tip carry-over este cazul in care se solicita participantilor sa aprecieze cat de grava este incalcarea regulii de a purta centura de siguranta, dupa ce in prealabil persoanele au fost chestionate despre gravitatea comiterii unui omor Participanti! inclusi in aceasta situatie vor aprecia ca este mai putin grava abaterea de a nu purta centura de siguranta prin contrast cu gravitatea omorului, in schimb, abaterea este considerata a fi mai Atat pentru reducerea evitarea efectului de reportare, cat si pentru evitarea distribuirii intr-o maniera inegala a consecintelor oboselii sau implicarii scazute in sarcina exista o solutie reparatorie, denumita contrabalansare Pentru un numar redus de probe de completat (2-3 probe) ideal ar fi sa se apeleze la contrabalansarea totala, ceea ce inseamna ca ordinea in care se raspunde la probe este diferita de la o persoana la alta, acoperindu-se toate grava de catre participantii care ar raspunde mai intai la intrebarea respectiva si abia mai apoi la cea legata de infractiunea de omor Dincolo de efectele de reportare bazate pe efectul de contrast sau de cele bazate pe efectul combinatiile posibile De exemplu, daca exista doua probe sarcini (A si B), acestea pot fi prezentate randomizat, fie in ordinea AB, fie in ordinea BA in cazul a trei probe (ABC) combinatiile de similaritate, se poate vorbi despre un efect de posibile sunt ABC, ACB, BCA, BAC, reportare in urma exersarii (practicarii repetate a CAB si CBA sarcinii), astfel incat sarcinile aflate la final sa fie realizate mai rapid (facil), daca se aseamana cu primele Oboseala lipsa Daca sarcinile pe care le are de rezolvat o de motivare persoana intr-un design intragrup solicita un efort indelungat din partea respondentilor, este posibil sa se instaleze oboseala, fapt ce ar afecta performanta in sarcinile aflate spre finalul setului de probe de completat De asemenea, in cazul persoanelor cu motivatie scazuta se poate instala dezinteresul si poate creste riscul de completare la intamplare a probelor aflate spre finalul setului de sarcini primite Daca numarul de probe este unul mai ridicat, devine imposibil sa apelam la contrabalansarea totala deoarece numarul de combinatii posibile depaseste adesea numarul de participanti intr-un studiu (de exemplu, daca ar fi sa combinam 5 probe intr-o maniera random unica vom avea 5! combinatii posibile, adica 120 de combinatii unice) in aceste cazuri se apeleaza la solutii de contrabalansare partiala, dintre care cea mai cunoscuta este patratul latin (detalii in Pelham si Blanton, 2007) in situatia combinarii a patru probe: A, B, C si D este necesar ca acestea sa fie aplicate randomizat in patru succesiuni diferite: ABCD, BADC, CDAB si DCBA Cresterea ideal ar fi ca participantii la un studiu sa nu riscului ca intuiasca ce se urmareste exact prin studiul participantii sa respectiv pentru a nu fi afectati in raspunsurile Desigur, cea mai buna solutie in acest context ar fi renuntarea la designul intragrup, in favoarea unuia integrup, intuiasca ipotezele studiului lor de aceste presupozitii (in limba engleza acest deoarece este mai putin probabil ca caz este cunoscut participantii sa intuiasca despre ce era sub denumirea de demand characteristics) De exemplu, daca participantii efectueaza exercitii de relaxare in conditii de liniste, apoi fac aceste exercitii in conditii in care asculta muzica clasica, pot intui mai usor ca studiul vizeaza efectul pe care ambientul sonor il are asupra eficientei utilizarii unor tehnici de relaxare si pot decide sa raspunda intr-un mod care sa-l vorba in experiment, in contextul in care ar fi fost supusi doar conditiei de a exersa tehnicile de relaxare in liniste, spre exemplu A doua modalitate de lucru valabila atat pentru designuri de tip intergrup, cat si pentru cele de tip intragrup este introducerea unor intrebari directe in partea de debriefing multumeasca pe experimentator (considerand ca (finalul studiului) in care se solicita nivelul mai profund de relaxare este atins in participantilor sa intuiasca ipoteza contextul in care se asculta muzica clasica) studiului asteptarile cercetatorului, insotita de decizia de a-i elimina pe aceia care intuiesc ipotezele studiului din cauza riscului crescut ca raspunsurile acestora sa fie distorsionate in favoarea conformarii ipotezei in ciuda acestor neajunsuri ale unui design de tip intragrup , acesta are avantajul de a controla toate variabilele straine care tin de individul examinat, fiind vorba de aceeasi persoana supusa unor contexte experimentale diferite Acest fapt conduce la o putere statistica superioara de a testa efectele urmarite, in conditiile unui numar mai redus de participanti Spre deosebire de acest caz, in designurile experimentale de tip intergrup principala problema care necesita rezolvare este tocmai controlul variabilelor straine ce tin de caracteristicile participantului, in lipsa acestui control putand fi afectate concluziile cu privire la relatia de tip cauza-efect Pentru a rezolva aceasta problema cea mai potrivita solutie este decizia de a distribui participantii in grupele experimentale intr-o maniera aleatorie (randomizata) pentru a egaliza (controla) astfel potentialul efect distorsionant pe care variabilele confundate 1-ar putea juca asupra relatiei cauzale studiate inainte de a explicita in detaliu ce presupune distribuirea randomizata a participantilor in grupele experimentale, se cuvine sa precizam o ultima problema ce poate afecta interpretarea rezultatelor obtinute in urma manipularii experimentale а Vi, si anume problematica variabilelor confundate 4 1 2 2 Problema variabilelor confundate in cazul manipularii Vi Variabilele confundate (confounding variables, nuisance variables sau hidden variables) mai sunt cunoscute si sub titulatura de variabile ascunse sau variabile straine, fiind vorba de acele variabile pe care cercetatorul nu le controleaza intr-un mod explicit, dar care pot afecta validitatea interna a unui studiu De aceea se impun masuri de control experimental sau statistic al efectului acestora Detalii suplimentare despre acest tip de variabile sunt oferite in caseta 5 4 din capitolul urmator Cele mai clare cazuri de variabile confundate pot fi evidentiate in cazul studiilor de tip non-experimental De exemplu, Pelham si Blanton (2007) evidentiaza complexitatea fiintei umane, fapt ce favorizeaza existenta unor variabile confundate De pilda, in urma unui studiu longitudinal ar putea reiesi urmatorul rezultat statistic corect: exista o mortalitate mai crescuta la indivizii care s-au tatuat decat in randul celor care nu au niciun tatuaj Mai mult, riscul de a deceda, in intervalul de zece ani avut sub observatie, este cu atat mai ridicat cu cat indivizii poseda mai multe tatuaje Desigur, o asemenea concluzie ar fi cauzata de existenta unor variabile straine necontrolate (variabile confundate), pentru ca este putin probabil sa poata fi controlate toate variabilele posibile, responsabile pentru un asemenea rezultat De exemplu, o serie de factori ce cresc mortalitatea sunt asociati mai frecvent persoanelor care se tatueaza Astfel, persoanele care au mai multe tatuaje tind sa adopte un stil de viata bazat pe: (a) un consum mai ridicat de tutun si alcool; (b) o dieta cu multe grasimi si consum redus de fibre; (c) complianta scazuta la tratamentele necesare in cazul unor conditii cronice precum hipertensiune arteriala sau diabet; (e) un stil mai agresiv (mai putin precaut) de conducere a autovehiculului; (f) o preferinta pentru motociclete, ca mijloc de locomotie; (g) nesocotirea unor norme si reguli sociale etc Desigur, daca am fi controlat toti acesti factori posibili, asocierea dintre tatuare si varsta decesului ar fi devenit, probabil, nesemnificativa statistic, insa este greu de crezut ca este fezabil sa controlam toate variabilele confundate posibile Pe scurt, variabilele confundate sunt cele la care cercetatorul, fie nu s-a gandit, fie nu le-a putut controla, dar care prin natura lor (variaza sistematic cu variabilele supuse asocierii - in cazul studiilor non-experimentale, respectiv cu Vi si VD - in cazul studiilor experimentale) Ele pot reprezenta sursa reala pentru efectul (relatia) observat, afectand astfel validitatea unui studiu Caracteristici ale indivizilor Surse de distorsiune (variabile confundate) implementare defectuoasa Caracteristici ale metode lor procedurilor Figura 4 2 Surse ale distorsiunilor determinate de variabile confundate 4 1 2 2 1 Variabile confundate avand drept sursa caracteristicile participantilor in studiile experimentale, aceste situatii de variabile confundate legate de caracteristicile participantilor sunt controlabile in designurile de tip intergrup se apeleaza la distribuirea randomizata a subiectilor in grupele experimentale -procedeu menit sa conduca la constituirea unor grupe echivalente (similare) din perspectiva variabilelor potential confundate -, aceasta metoda nu este una infailibila, situatie in care discutam despre un bias (distorsiune) de selectie in cazul designului intragrup, variabilele confundate ce tin de caracteristicile participantilor sunt controlate integral prin aplicarea procedurilor pe aceiasi subiecti Sectiunea 4 1 3 prezinta pe larg procedura cea mai des intalnita, aceea a alocarii randomizate a participantilor in grupele experimentale 4 1 2 2 2 Variabile confundate avand drept sursa metodele sau procedurile utilizate Nu doar participantii pot ascunde variabile confundate in sine, ci si procedurile experimentale utilizate in manipularea Vi (diferite modalitati ale presupusei variabile-cauza) Sa presupunem ca un individ este interesat sa urmareasca daca persoanele anxioase retin mai bine cuvinte cu valenta negativa (de exemplu, bolnavicios), decat cuvinte cu valenta pozitiva (de exemplu, echitabil) Din nefericire, aceste cuvinte nu difera numai prin valenta lor afectiva, ci si prin nivelul de familiaritate (mai utilizat fiind bolnavicios), prin nivelul de activare (arousal) - mai "viu" fiind tot cuvantul bolnavicios etc Daca nu sunt controlate aspecte, precum gradul de familiaritate, lungimea cuvintelor, nivelul lor de expresivitate (intensitate), ar fi dificil sa afirmam ca diferentele observate in performanta mnezica ar fi determinate de valenta afectiva a cuvintelor, deoarece exista si alte dimensiuni prin care acestea difera Acelasi lucru poate fi avut in vedere inclusiv in situatii experimentale complexe De pilda, atunci cand se compara doua forme de psihoterapie din perspectiva nivelului lor de eficienta este important ca ambele forme sa fie implementate de catre un personal calificat, ca ambele sa aiba niveluri procentuale similare de participanti care renunta la psihoterapie inainte de termenul convenit etc Pentru eliminarea efectului unor variabile straine (variabile pe care cercetatorul le-a luat in considerare ca potentiali factori ce afecteaza relatia cauza-efect) solutiile de corectare sunt controlul statistic (masurarea variabilelor respective si eliminarea efectului acestora prin tehnici statistice de tipul ANCOVA, corelatii partiale sau regresii ierarhice), respectiv controlul metodologic (de exemplu, daca genul persoanei ar constitui o variabila confundata se pot efectua studii doar pe femei sau pot fi formate grupele experimentale in proportii egale pe sexe etc ) De asemenea, pentru eliminarea efectului unor variabile straine neluate in calcul sau necontrolate initial si pentru decelarea impactului acestora la nivelul variabilei dependente, corectarea se poate face si prin replicarea rezultatelor obtinute in contexte experimentale similare, dar nu identice, precum este exemplul descris in caseta 4 2 Caseta 4 2 Descrierea unui caz de variabila confundata intalnit in studiile experimentale derulate in scop explicativ (adaptare dupa Pelham si Blanton, 2007) Dispozitiile afective pozitive ne determina sa fim mai altruisti? Pentru a raspunde la aceasta intrebare ce vizeaza identificarea unei relatii de tip cauza-efect intre dispozitia afectiva si comportamentul altruist, primele cercetari experimentale realizate intr-un mod riguros au distribuit randomizat participantii, fie in grupa celor care primeau un feedback pozitiv pentru activitatea depusa pentru a intensifica dispozitia afectiva pozitiva a acestor persoane, fie in grupa celor care nu primeau un asemenea feedback Datele obtinute din astfel de studii sustin ipoteza avuta: cei care au primit un feedback pozitiv au relatat o dispozitie afectiva pozitiva mai intensa decat grupul de control si, ce este mai important, au fost mai altruisti in comportamentul lor (de exemplu, au acordat mai multi bani unor complici care "cerseau" la iesirea din locatia experimentala) Problema cu aceasta manipulare experimentala este faptul ca a acorda un feedback pozitiv unui interlocutor are ca efect nu numai inducerea unei dispozitii afective pozitive, ci si modificarea credintei acestuia in competenta sa de a face fata provocarilor Or, persoanele care se simt mai competente intr-un domeniu sunt, de asemenea, mai predispuse sa-i ajute pe cei care le solicita ajutorul, fiind astfel mai altruiste (isen si Levin, 1972 apud Pelham si Blanton, 2007) De aceea, nu este clar daca altruismul mai ridicat este o consecinta a unei dispozitii afective pozitive sau unei augmentari a increderii celor chestionati in competenta lor de a se descurca in sarcini Pentru a rezolva aceasta dilema, alti cercetatori au propus o manipulare diferita a dispozitiei afective care sa nu conduca si la modificarea credintei participantilor in competenta lor in acest sens, celor din grupul experimental li s-au oferit prajiturele in timp ce rezolvau sarcina, pentru a observa daca acest surplus indus de buna-dispozitie conduce la augmentarea comportamentului altruist Datele obtinute sprijina ipoteza ca dispozitia afectiva pozitiva (mai ridicata in grupul celor care au primit prajituri) a condus la niveluri mai ridicate ale comportamentului altruist Chiar daca acest context experimental nu mai este unul care sa conduca la modificari in competenta autoperceputa a respondentilor, este posibil ca rezultatul obtinut sa fie distorsionat de un alt aspect Astfel, cei din grupul experimental au fost expusi unui model de comportament prosocial (primind prajituri din partea unor straini), in conditiile in care expunerea la comportamente prosociale este o alta cauza a aparitiei unei conduite de tip altruist in sfarsit, pentru a rezolva si aceasta posibila situatie de variabile confundate, o alta manipulare propusa pentru inducerea unei dispozitii afective pozitive a fost aceea de a manipula contextul experimental astfel incat cei din conditia experimentala sa gaseasca o moneda pierduta (nerevendicata) spre deosebire de cei din grupul de control care nu au avut un asemenea "noroc" si in acest caz, rezultatele au indicat ca persoanele din grupa cu o dispozitie afectiva pozitiva mai ridicata (norocosii) au manifestat un comportament prosocial mai intens decat cei din grupa de control Acest design are insa meritul de a nu conduce nici la modificari in competenta autoperceputa a candidatilor, nici la situatii de expunere la un model prosocial Prin urmare, atat prin replicarea rezultatelor in contexte experimentale diferite, cat mai ales prin identificarea unui design de cercetare care sa elimine posibile explicatii alternative (variabile confundate), exista un sprijin consistent pentru a afirma ca o dispozitie afectiva pozitiva creste comportamentul de tip altruist Desigur, pe langa solutia principala de a manipula experimental Vi de interes astfel incat aceasta sa inceteze a mai fi afectata de o potentiala variabila confundata, exista intotdeauna posibilitatea replicarii unui studiu, cu includerea unei masuratori pentru variabila confundata analizata De exemplu, in contextul repetarii unui studiu experimental bazat pe inducerea unei dispozitii afective pozitive ca urmare a unui feedback pozitiv, se poate include suplimentar drept covariabila masurarea competentei autopercepute prin intermediul unei scale validate din punct de vedere psihometric, astfel incat analizele statistice efectuate sa evidentieze eventualele diferente dintre grupul experimental si cel de control, in contextul in care este controlat statistic nivelul competentei autopercepute (in situatia ipotetica in care toti respondentii ar avea acelasi nivel al competentei autopercepute) 4 1 2 2 З Variabile confundate avand drept sursa implementarea distorsionata a studiului in aceasta categorie sunt incluse toate acele cauze potentiale care vizeaza direct modul in care este implementat un anumit studiu De exemplu, in cazul unui experiment pot aparea distorsiuni cauzate de: (a) lipsa de standardizare a instructajului oferit participantilor la studiu (variatii in lungimea si nivelul conversatiilor cu participantii premergatoare studiului, instructaj scurtat in cazul unor participanti care par a prinde repede ce au de facut etc ); (b) distorsiuni cauzate de caracteristicile si asteptarile cercetatorului asistentului de cercetare (caracteristici demografice si stil de lucru diferit al asistentilor de cercetare; comportament diferentiat fata de participanti in functie de conditia lor experimentala - cum ar fi niveluri diferite de entuziasm si de atentie acordata participantilor); (c) distorsiuni legate de caracteristicile sarcinii experimentale (demand characteristics) (daca sarcinile sunt prea transparente, participantii vor intui ipotezele cercetarii si se vor comporta predominant intr-un mod care sa multumeasca experimentatorul confirme asteptarile acestuia privind cel mai potrivit mod de a raspunde sau a se comporta) Pentru a elimina asemenea posibile distorsiuni, pot fi implementate o serie de masuri precum: (a) standardizarea procedurilor de testare (instructaj oferit de catre calculator, utilizarea unor "falsi subiecti" pentru a verifica gradul de respectare a instructiunilor de examinare); (b) utilizarea unui design de cercetare de tip orb (in care participantii sa nu cunoasca exact conditia in care au fost distribuiti - grupuri placebo - sau in care cei care efectueaza evaluarile nu cunosc carui grup apartin participantii testati) sau dublu orb (in care atat participantii, cat si asistentii de cercetare, cel putin cei care efectueaza masuratorile de interes, nu cunosc carui grup experimental apartin indivizii testati); (c) utilizarea unui interviu sau a unui chestionar la finalul cercetarii (debriefing) pentru a detecta cazurile potentiale de a fi afectate de caracteristicile sarcinii (indivizii care au intuit corect ipoteza vizata de cercetare si relatia dintre sarcinile primite spre rezolvare si ipoteza studiului) 4 1 2 3 Problema arteiactelor in cazul manipularii Vi Spre deosebire de variabilele confundate care variaza atat cu Vi, cat si cu VD, artefactele reprezinta o serie de distorsiuni constante in cadrul studiului experimental Prin efectul lor constant, ele nu afecteaza validitatea interna a unui studiu, ci pe cea externa, deoarece rezultatul obtinut intre Vi si VD este valabil numai in contextul in care artefactul respectiv este prezent in categoria artefactelor intra de obicei acele variabile pe care cercetatorul nu este interesat sa le studieze, dar care prin efectul lor afecteaza validitatea externa a concluziilor unui studiu Un exemplu de artefact este reactivitatea participantilor intr-un studiu experimental de laborator Acestia pot adopta, pentru ca sunt observati un anumit comportament care sa nu fie replicabil in contexte sociale ecologice Faptul ca majoritatea studiilor experimentale se deruleaza in conditii de laborator pentru a controla diferite variabile straine, nu face altceva decat sa replice efectul artefactului in contexte in care participantul realizeaza faptul ca este monitorizat comportamentul sau Cresterea realismului situatiei experimentale poate contribui la diminuarea efectului pe care artefactul reactivitatii participantilor il joaca in dinamica dintre Vi si VD Un alt exemplu de artefact este mediul cultural (de exemplu, unele efecte pot fi replicate doar in societati individualiste, orientate spre competitie, dar nu si in medii culturale estice, cum este asocierea dintre perceptia unicitatii - "sunt o persoana speciala" si stima de sine) Daca in societatile individualiste exista o asociere pozitiva intre perceptia unicitatii si stima de sine, in cele colectiviste aceasta relatie este una negativa iata un alt exemplu: un consilier crestin este interesat sa studieze rolul benefic al religiei si orientarii catre spiritualitate la bolnavii de cancer; acest rol pozitiv a fost replicat si in alte studii efectuate pe credinciosi Statutul de persoana credincioasa poate reprezenta in aceste cazuri un artefact Pentru a controla influenta acestui factor, ar fi interesant sa vedem daca religia si practicile spirituale sunt mecanisme benefice de coping la bolnavii de cancer care se declara atei in sfarsit, artefacte pot rezulta si din favorizarea (standardizarea) unor anumite proceduri de lucru in studiile experimentale De exemplu, in cazul conditionarii afective (transmiterea valentei afective de la un stimul neconditionat spre un stimul conditionat, cu valenta initiala neutra), se pare ca unul dintre cele mai importante mecanisme pentru aparitia efectului este constientizarea asocierii dintre stimulul neconditionat si cel conditionat insa aceasta concluzie are o valabilitate limitata de vreme ce peste 90% dintre studiile din aceasta zona utilizeaza doar masuri explicite pentru a aprecia preferinta pentru stimulul conditionat (Hoffman et al , 2011) Daca s-ar lua in calcul masuri implicite ale preferintei pentru stimulul conditionat mecanismul pentru aparitia schimbarii ar putea fi unul diferit de cel al constientizarii asocierii dintre stimuli Spre deosebire de cazul variabilelor confundate, artefactele sunt mult mai dificil de identificat si de corectat Pentru a evita situatia in care relatia dintre Vi si VD exista doar in contextul existentei unor artefacte, ideal ar fi sa se replice rezultatele prin varierea situatiilor experimentale pe diferite dimensiuni relevante, pentru a creste validitatea externa a concluziilor si, indeosebi, validitatea ecologica a rezultatelor obtinute Caseta 4 3 Studiu de caz Pornind de la datele existente in literatura de specialitate, terapia prin muzica poate fi o metoda eficienta de reducere a anxietatii si, in general, de reducere a stresului, atat la adulti, cat si la copii (Bradt si Dileo, 2009; Klassen, Liang, Tjosvold, Klassen si Hartling, 2008 etc ) Tipul de muzica pare a fi un factor important, cele mai bune rezultate din studiile facute pe populatie americana fiind obtinute pe muzica clasica, muzica din genul New Age si latino-jazz, iar cele mai putin eficiente fiind obtinute pe muzica rock (apud Pfister, Jones si Cheek, 2011) O cercetare efectuata in Romania pe aceasta tema (Gherman, 2008) a urmarit sa replice efectul pozitiv al muzicii asupra reducerii anxietatii pe un lot de pacienti cardiaci supusi unei interventii invazive (stentare carotidiana) Au fost avute in vedere trei tipuri de muzica, audiate cu acordul participantilor la casti, in timpul derularii procedurii de stentare: fie muzica clasica, fie muzica latino-jazz, fie folclor (muzica populara) Rezultatele studiului experimental au aratat ca nivelul cel mai scazut de anxietate a fost obtinut in conditia de ascultare a muzicii populare, in timp ce s-a inregistrat chiar o crestere a nivelului de anxietate postoperatorii fata de pretest, in grupul celor care au ascultat muzica latino-jazz, respectiv clasica Ce cauze (explicatii) sunt posibile pentru divergenta rezultatelor, pornind de la premisa ca toate studiile au avut un nivel calitativ superior (randomizare, fara alte artefacte induse de experimentator)? 1 Probleme privind validitatea de construct a studiului Divergenta este cauzata de prezenta unor variabile confundate in modul de manipulare a Vi: familiaritatea cu genul muzical; preferinta pentru un anumit gen muzical Este posibil ca responsabilitatea pentru scaderea nivelului de anxietate sa nu apartina caracteristicilor melodice (tonalitate, ritm), ci gradului de familiarizare a persoanei cu genul muzical respectiv si sau preferintele sale muzicale interventia la care sunt supusi participantii este una invaziva, prin urmare inductoare a unui cadru anxiogen Apelul la stimuli familiari sau placuti pare a fi chiar o modalitate rezonabila de coping in asemenea situatii Daca aceasta explicatie este adevarata, atunci este afectata validitatea interna a studiilor anterioare, iar concluzia ca muzica clasica sau cea latino-jazz sunt cele mai eficiente in reducerea anxietatii si stresului ar fi hazardata in acest context ar fi nevoie de studii suplimentare cu scopul de a stabili relatia dintre familiaritate, preferinta sau tipul de muzica ca elemente active pentru reducerea anxietatii stresului 2 Probleme privind validitatea externa a studiului Divergenta este cauzata de prezenta a doua posibile artefacte in studiile anterioare: (a) mediul cultural relativ omogen (peste 90% din studiile anterioare sunt realizate in SUA, pe loturi preponderent formate din studenti); (b) momentul introducerii calupului muzical Astfel, esantionul din Romania difera semnificativ fata de cel utilizat in studiile anterioare, atat din perspectiva gusturilor muzicale, cat si din perspectiva nivelului de studii, deoarece participantii inclusi in studiul din Romania apartin intr-o proportie de peste 75% celor care au cel mult 8 clase de scoala, un grup-tinta care, foarte probabil, este familiarizat si indrageste muzica populara, dar in acelasi timp manifesta reticenta fata de stilul muzicii clasice sau latino-jazz in privinta momentului introducerii muzicii, exista alte diferente intre studiul realizat in Romania si majoritatea celor realizate anterior in studiile anterioare, participantii ascultau muzica intr-un context preoperator (sala de pregatire pentru interventie), in timp ce in studiul efectuat in Romania participantii ascultau muzica la casti in timpul interventiei de stentare carotidiana) Daca aceste explicatii sunt adevarate, atunci validitatea interna a studiilor ramane una corecta (muzica clasica si cea latino-jazz pot fi eficiente in reducerea anxietatii), dar dobandesc o valabilitate limitata (de exemplu, in mediul cultural american in cazul persoanelor cu studii superioare etc ), fiind in acest fel afectata validitatea externa, adica gradul de generalizare a rezultatelor in sfarsit, divergenta dintre rezultate poate avea drept sursa combinatia elementelor mentionate anterior, situatie in care ar fi afectata, atat validitatea de construct, cat si cea externa Desigur, fiind vorba de un singur studiu cu rezultate contrare, ar fi nevoie de replicarea acestor rezultate, preferabil de catre echipe de cercetatori diferiti, pentru ca dovezile de combatere a concluziilor initiale sa fie considerate unele solide Daca asemenea studii ar replica rezultatele obtinute in studiul din Romania, s-ar ajunge la revizuirea asumptiei ca numai anumite tipuri de muzica sunt eficiente in combaterea anxietatii 4 1 3 Controlul variabilelor straine prin randomizare Atunci cand se compara performantele grupului experimental cu cele ale grupului de control, este important ca acest lucru sa se realizeze in conditiile in care riscul existentei unei distorsiuni (bias) de selectie a participantilor sa fie minim De asemenea, este important ca riscul aparitiei unor modificari temporale in mod diferentiat intre grupe sa fie minim Avem nevoie de acest lucru pentru a ne putea increde ca eventualele diferente observate sunt determinate de manipularea variabilei independente (cauza acceptata a diferentelor existente intre grupe) si nu de existenta unor diferente observate in cazul altor variabile straine (diferente existente intre grupul experimental si cel de control) O modalitate de a exercita controlul asupra variabilelor straine, cunoscuta sub denumirea de control statistic al variabilelor, se face prin intermediul unor tehnici statistice cum ar fi regresia multiliniara ierarhica sau analiza de covarianta (ANCOVA) Cu ajutorul acestor tehnici se poate elimina efectul variabilelor straine luate in calcul asupra relatiei cauzale de interes Problema cu acest tip de control al variabilelor straine este aceea ca nu pot fi avute in vedere toate variabilele posibile care pot afecta relatia de tip cauza-efect studiata De exemplu, intr-un studiu care compara eficienta unei anumite metode alternative de predare a matematicii comparativ cu metoda uzuala de predare din perspectiva rezultatelor obtinute la bacalaureat la disciplina matematica pot exista o multitudine de diferente posibile intre elevi cum ar fi: (a) niveluri diferite de cunostinte despre matematica intre grupul experimental si cel de control; (b) niveluri diferite ale abilitatilor cognitive generale (de inteligenta) ce afecteaza ritmul invatarii si retentia cunostintelor noi; (c) niveluri diferite de motivatie pentru performanta scolara; (d) niveluri diferite de expertiza din partea profesorilor care predau cele doua metode comparate; (e) niveluri diferite ale climatului scolar; (f) politici diferite cu privire la absenteismul scolar; (g) niveluri diferite de statut socioeconomic ale parintilor Desi pot fi controlate statistic multe asemenea variabile importante pentru a elimina efectul acestora asupra relatiei dintre variabila independenta (metoda de predare) si cea dependenta (performanta la bacalaureat), este improbabil ca vor putea fi controlate statistic toate variabilele care au impact asupra relatiei dintre Vi si VD Solutia optima pentru a controla efectul potential al tuturor variabilelor relevante asupra relatiei dintre Vi si VD nu este aceea a controlului statistic (masurarea tuturor acestor variabile), ci a controlului exercitat prin design, adica prin alocarea randomizata a subiectilor in grupele experimentale Acest lucru presupune faptul ca indivizii inclusi in studiu nu sunt comparati in cadrul grupurilor naturale din care fac parte (de exemplu, copii de la gradinite de stat vs copii de la gradinite particulare) si nici macar nu au posibilitatea de a-si alege ei grupul din care sa faca parte in schimb, indivizii inclusi in studii experimentale consimt informat sa lase in responsabilitatea cercetatorului sarcina de a-i distribui aleatoriu (ca intr-o loterie) intr-unul din grupele experimentale, chiar fara a li se comunica decat la finalul studiului natura reala a grupului din care au facut parte Principala problema pe care o rezolva alocarea randomizata a participantilor in grupele experimentale este eliminarea distorsiunii de selectie a participantilor, cu conditia ca grupurile formate sa fie suficient de mari (de exemplu, peste 40 de persoane in fiecare grup experimental) Pentru a intelege importanta acestui aspect, vom apela la un exemplu din stiintele medicale in mod obisnuit se recunoaste impactul pozitiv al consumului de suplimente alimentare precum vitamina C sau vitamina E ca factori protectivi pentru imunitate etc Aceste concluzii se bazeaza insa pe studiul unor grupuri natural constituite (fara alocare randomizata), bazata pe compararea celor care consuma asemenea suplimente alimentare in mod voluntar cu cei care nu apeleaza la aceste suplimente Asemenea rezultate esueaza insa in a tine seama de alte diferente existente intre cele doua grupe comparate (de exemplu, cei care folosesc asemenea aditivi tind sa apeleze de asemenea la o dieta alimentara mai corecta, sa fie mai putin predispusi la consumul de alcool si tutun etc ) Prin alocarea randomizata a participantilor intr-un asemenea studiu se apeleaza la o populatie selectionata (de exemplu, persoane care nu consuma alcool decat ocazional, care nu fumeaza, nu au un istoric al unor boli cronice, nu consuma aditivi alimentari) pe care apoi ii imparte aleatoriu in doua grupe: unii care vor consuma regulat vitamina C si cei care cred ca vor consuma regulat vitamina C (primind pastile placebo) Daca in aceste conditii stricte de control exista diferente intre cei care consuma vitamina C si cei care nu consuma vitamina C, am putea spune ca vitamina C are un efect benefic asupra sanatatii din perspectiva reducerii riscului morbiditatii Surprinzator, poate, rezultatele obtinute in asemenea conditii de control nu confirma credintele populare Astfel, o metaanaliza de studii experimentale realizata de Bjelakovic et al (2007) a aratat ca cei care consuma antioxidanti precum vitaminele A, E sau betacaroten prezinta un risc crescut de mortalitate comparativ cu cei din grupurile de control - tip placebo), iar in cazul celor care consuma suplimente precum selenium sau vitamina C nu exista diferente semnificative statistic cu privire la riscul mortalitatii intre grupul experimental si cel de control Asadar, comparatiile intre grupul experimental si cel de control au sens in a fi interpretate corect doar in absenta unei distorsiuni in selectia participantilor, iar acest lucru poate fi realizat, fie prin apelul la un design intragrup (acolo unde este posibil), fie prin alocarea randomizata a participantilor in grupele experimentale, in cazul unor designuri de tip intergrup Merita mentionata aici distinctia conceptuala importanta dintre selectia aleatorie a unui esantion de persoane din populatia de interes (random selection) si alocarea randomizata a subiectilor in grupe de studiu (random assignment) Primul caz are in vedere ceea ce se intampla adesea in sondajele de opinie (chestionarea unui numar de 100 de persoane dintr-o comuna cu un total de 5 200 de locuitori prin selectarea aleatorie a persoanelor chestionate -aspect ce potenteaza validitatea externa a unui studiu) Cel de-al doilea caz nu-si propune sa selecteze aleatoriu esantionul chestionat, acesta putand fi unul de convenienta (cum ar fi 100 dintre locuitorii satului prezenti la o intalnire organizata de primarie), ci isi propune sa ii distribuie aleatoriu pe participanti in grupele experimentale pentru a-i chestiona in doua situatii diferite: unii fiind rugati sa aprecieze activitatea primariei, in regim de anonimat, iar altii, in contextul in care li se solicita sa-si dezvaluie identitatea inainte de a-si exprima opiniile Alocarea randomizata a participantilor in grupele de studiu este o conditie esentiala in designurile intergrup pentru a asigura un nivel ridicat al validitatii interne a cercetarii 4 1 З 1 Sugestii practice pentru alocarea randomizata a participantilor A aloca randomizat participantii in grupele experimentale inseamna a acorda sanse egale tuturor participantilor de a fi inclusi in oricare dintre conditiile experimentale ale studiului intr-o varianta minimala, acest lucru presupune apelul la unele metode clasice precum randomizarea sistematica (de exemplu, intr-un design cu trei grupe se utilizeaza un pas de trei, astfel incat indivizii cu numarul de ordine [inscriere] 1, 4, 7, 10 etc sunt distribuiti in primul grup, cei cu numerele 2, 5, 8, 11 etc sunt distribuiti in cel de-al doilea grup, iar indivizii cu numerele 3, 6, 9, 12 etc sunt inclusi in cel de-al treilea grup experimental) Alte variante rudimentare de alocare randomizata a indivizilor presupun utilizarea unor criterii neutre de selectie (cei nascuti in luni pare vs impare; cei care au initiala numelui de familie de la A la i vs de la J la Z; ultima cifra para sau impara din CNP-ul participantului etc ) intr-o lume ideala, asemenea procedee ar fi considerate adecvate pentru o alocare randomizata de calitate Din nefericire, insa, aceste criterii pot conduce la conduite constiente sau inconstiente soldate cu o distorsiune de selectie De exemplu, in mod constient, unui participant ii poate fi rezervat un numar care sa-l distribuie intr-o anumita grupa (de exemplu, daca la interviul initial participantul pare a fi un individ recalcitrant si rezistent la sugestii, poate ajunge sa fie inclus in grupul de control, deoarece se anticipa ca nu vor fi sesizate modificari mari intre test si retest) De asemenea, in cazul in care se cunoaste deja grupul in care va fi distribuit un anumit participant (pentru ca initiala numelui sau de familie incepe cu litera V) acest lucru poate influenta evaluarea initiala a indeplinirii neindeplinirii criteriilor de eligibilitate de a fi inclus in studiu, mai ales in contextul in care criteriile de eligibilitate sunt vagi De pilda, individul poate fi considerat drept eligibil daca urmeaza a fi distribuit in grupul in care se estimeaza ca ar avea sanse sa "ajute" la sustinerea ipotezei de lucru, respectiv sa ramana neselectat (declarat neeligibil) daca se anticipa faptul ca nu este potrivit interventiei alocate (Torgerson si Torgerson, 2008) De aceea, o varianta optimizata a procesului de alocare randomizata a participantilor in grupele experimentale are in vedere ascunderea procesului de randomizare, astfel incat aceasta sa aiba loc fara a se cunoaste a priori in ce grupa urmeaza sa fie inclusa o anumita persoana testata Tabelul 4 2 sintetizeaza principalele recomandari aplicative privind practica alocarii randomizate in grupe experimentale la un nivel calitativ superior Cititorii interesati de o detaliere a acestor aspecte, precum si de alte variante adecvate de alocare randomizata pot gasi mai multe informatii in Torgerson si Torgerson (2008) Tabelul 4 2 Solutii optime de alocare randomizata a participantilor in grupele experimentale Denumire Descriere, avantaje si dezavantaje Randomizare Este cea mai intalnita forma de randomizare, usor implementabila prin apelul la solutii simpla software de generare a unor numere intr-o maniera aleatorie, insotita de decizia de a aloca participantii in functie de anumite criterii (cei carora li s-a alocat un numar par -in grupul experimental; cei carora li s-a alocat un numar impar - in grupul de control) Avantajul acestei solutii este ca cel care face programarile pentru evaluare sau evaluarile (de eligibilitate) nu stie in avans din ce grupa va face parte individul Mai mult, daca distribuirea se face de catre un alt coleg, neimplicat in derularea experimentului, nu se va cunoaste alocarea individului nici dupa finalizarea partii de sere e ning initial Dezavantajul solutiei este acela ca poate conduce la grupuri inegale de subiecti si ca, indeosebi pentru un numar redus de participanti grupa, poate fi mai putin eficienta in a controla variabilele straine De asemenea, pentru studiile care necesita includerea unor participanti apartinand unui grup-tinta greu de gasit (de exemplu, persoane care au Randomizarea restrictionata in perechi (pairwise randomization) Randomizarea restrictionata stratificata grupata Randomizare adaptiva (minimizare) trecut prin stadiul de moarte clinica), ar fi nevoie de un interval mai lung de timp pentru constituirea grupelor, fapt ce conduce la cresterea riscului ca in anumite perioade sa fie selectati numai participanti pentru un anumit grup (daca calculatorul genereaza 5-6 numere consecutive indicative pentru acelasi grup experimental) Se cauta numarul minim de participanti (de exemplu, doua persoane in cazul a doua grupe, trei persoane in cazul a trei grupe) care sunt eligibili pentru a participa la studiu Cand acest numar minimal este atins, se apeleaza la numere generate aleatoriu de catre un program de calculator pentru a-i distribui in grupele aferente Solutia rezolva problemele randomizarii simple legate de inegalitatea numarului de subiecti din grupe sau de secventialitatea temporalitatea interventiei Dezavantajul solutiei consta in temporizarea aplicarii interventiei (de exemplu, un participant eligibil trebui sa astepte pana este identificata o alta persoana eligibila in cazul existentei a doua grupe experimentale) in plus, solutia are aceleasi probleme precum randomizarea simpla, si anume, riscul de a nu controla eficient toate variabilele straine in cazul unui numar redus de subiecti per grup experimental inainte de randomizare, participantii sunt impartiti dupa una sau doua variabile straine considerate a fi esentiale De exemplu, intr-un studiu care vizeaza eficienta persuasiva a doua tipuri de mesaje: cu accent pe aspecte cognitive (A) vs cu accent pe aspecte afective (B), randomizarea subiectilor in grupele experimentale se face dupa ce in prealabil a fost masurata complexitatea cognitiva a participantilor, masura care a condus la impartirea prealabila a participantilor in indivizi cu complexitate cognitiva ridicata vs scazuta Fiecare dintre cele doua categorii a fost supusa apoi procesului de randomizare in grupe de cate patru persoane, astfel incat daca grupului de patru persoane din categoria celor cu complexitate cognitiva ridicata le revin mesajele persuasive A, B, B, A, celuilalt grup de patru persoane din categoria celor cu complexitate cognitiva scazuta le revin mesajele B, A, A si B Calupul de patru litere (valabil pentru un design cu doua modalitati ale variabilei manipulate) isi schimba ordinea in mod aleatoriu (posibile fiind sase combinatii: ABAB, AABB, BABA, BBAA, ABBA si BAAB) Avantajul acestei solutii este acela ca permite controlul unor variabile straine importante inclusiv pentru un numar redus de subiecti per celula experimentala grup si ca pastreaza un echilibru numeric intre grupele experimentale Dezavantajele solutiei constau in dificultatea de a controla mai mult decat o singura variabila straina importanta (din motive de complexitate a designului) si in faptul ca ultima persoana din calupul de patru persoane este predictibila din perspectiva apartenentei sale la unul dintre cele doua grupuri) Minimizarea nu este decat partial o metoda de alocare randomizata a participantilor in grupele experimentale, deoarece ea presupune alocarea initiala (random) a jumatate dintre participantii eligibili pentru studiu De exemplu, daca randomizarea are loc la nivel de scoli, din cele opt scoli contactate doar patru vor fi randomizate simplu in una din cele doua grupe experimentale; celelalte patru scoli vor fi alocate pe baza rationala astfel incat sa obtinem profiluri similare de comparat; de exemplu, daca o scoala din centrul orasului, cu rata de promovabilitate ridicata la examenul de bacalaureat a fost distribuita initial prin randomizare in conditia experimentala A, cealalta scoala localizata central si avand o rata de promovabilitate ridicata la bacalaureat, ramasa nedistribuita, va fi distribuita in conditia experimentala B) Pentru a reduce riscul de distorsiune in selectie pentru scolile ramase de distribuit dupa incheierea procesului de randomizare simpla, este preferabil ca algoritmii de potrivire sa fie transpusi intr-un software pe calculator si sa se utilizeze o regula bazata pe probabilitati De exemplu, scoala potrivita pentru o anumita conditie experimentala poate fi selectata de catre calculator, in baza unei probabilitati de 80%, nu a uneia de 100% in asemenea conditii, minimizarea poate fi vazuta ca o metoda de randomizare adaptiva Pe scurt, randomizarea simpla si randomizarea in perechi constituie cele mai bune solutii de randomizare individuala a indivizilor atunci cand avem un numar destul de ridicat de participanti in fiecare conditie experimentala, iar designul cercetarii nu specifica vreun control special acordat unor variabile straine in schimb, minimizarea este solutia mai potrivita atunci cand avem de a face cu un studiu efectuat pe un numar scazut de persoane sau cand randomizarea se aplica la nivel de clustere, in conditiile in care gasirea de persoane eligibile pentru a participa la studiu necesita destul de mult timp in sfarsit, pentru designurile factoriale partial randomizate (randomized blocked), in care unele dintre Vi sunt variabile eticheta, precum si pentru cazurile in care se doreste in mod explicit controlul unor variabile straine, iar numarul de participanti la studiu este unul moderat, solutia potrivita este aceea de a utiliza randomizarea stratificata, intr-o varianta simpla sau grupata Figura 4 3 Solutii optime de alocare randomizata in functie de contextul cercetarii indiferent de modalitatea de randomizare aleasa, o randomizare de calitate ar trebui sa includa metode de ascundere a rezultatului alocarii in conditiile experimentale (allocation concealment) Solutia pentru a atinge acest deziderat vizeaza delegarea responsabilitatii randomizarii La ora actuala s-au dezvoltat servicii contra cost de randomizare a participantilor in studiu (Torgerson si Torgerson, 2008), insa este acceptabil si sa rugam un coleg neimplicat in studiu sa apeleze la generarea (extragerea) grupei din care face parte un participant declarat a fi eligibil, dupa ce a semnat, in prealabil, formularul de participare consimtita la studiu De asemenea este importanta mascarea cunoasterii grupului in care a fost distribuita o anumita persoana de catre cei care fac masuratorile evolutiei participantilor la studiu in timp (pretest, interim, posttest, urmarire [follow up]) Astfel, acestia nu vor fi influentati in aprecierile lor asupra evolutiei persoanei testate de cunoasterea apartenentei la unul sau altul dintre grupurile experimentale in stransa legatura cu acest punct se gaseste ideea mascarii alocarii randomizate si a conceptului de "orb" (blind) intr-un studiu experimental pot fi identificati trei tipuri de actori: cei care ofera interventia (de exemplu, terapeutii), cei care beneficiaza de interventie (de exemplu, clientii) si cei care evalueaza progresele observate (de exemplu, asistentii de cercetare) Asadar putem vorbi in termeni populari de una dintre cele trei variante experimentale de orbire: simplu-orb, dublu-orb sau triplu-orb, in functie de cate categorii de actori nu cunosc carui grup experimental ii apartine o anumita persoana in domeniul psihologiei este putin probabil ca toate cele trei categorii de actori implicati sa poata fi supusi conditiei de orbire, deoarece este putin probabil ca experimentatorul sa nu cunoasca la ce fel de interventie este supusa o anumita persoana in schimb, asistentii de cercetare care fac evaluarea progresului la nivelul VD si uneori participantii (prin includerea unui grup de control de tip placebo) se pot regasi in situatia de a nu cunoaste grupul din care au facut parte, acest lucru fiind mentinut pana la finalul studiului, pentru a nu influenta raspunsurile lor obtinute in perioada de urmarire (follow-up) Standardele CONSORT (Moher et al , 2010) recomanda inlocuirea termenilor "orb", "dublu-orb" sau "triplu-orb" cu precizarea prezentei sau absentei conditiei de orbire, iar in cazul din urma, cu completarea categoriilor afectate de aceasta conditie si prezentarea modalitatilor concrete in care s-a realizat "orbirea" 4 1 4 Controlul exercitat prin nivelul de comparatie ales Asa cum am precizat inca de la inceputul acestui capitol, ideea de control al unor variabile externe este una esentiala pentru succesul oricarui demers experimental Un alt nivel de analiza privind controlul exercitat vizeaza nivelul comparativ, adica specificul grupului de control ales Din acest punct de vedere, rezultatele grupului experimental pot fi comparate cu cele ale unui grup de control care poate lua forme diferite precum: (a) control prin absenta tratamentului; (b) control prin aplicarea unei interventii uzuale (ce se intampla de obicei); (c) control prin compararea cu interventia standard (cea mai buna solutie existenta in acel moment); (d) control prin raportarea la o alta forma de interventie etc Din acest punct de vedere Kazdin (2010) expune principalele tipuri de grup de control, sintetizate in tabelul 4 3 Tabelul 4 3 Tipuri de grup de control (lot martor) in functie de scopul cercetarii Denumire si descriere Utilitate (scop vizat) Probleme Grup cu interventie absenta (no treatment group) Se verifica daca in anumite situatii, absenta unei interventia are un interventii este discutabila etic, indeosebi efect Este vorba insa daca sunt avute in vedere cazuri medicale Cei din grupul de control nu primesc niciun fel de interventie despre un efect ce sau educationale in care participantii la incorporeaza si studiu au nevoie de o interventie efectul determinat de Se constata un numar mai mare de alte aspecte, cum ar refuzuri de a participa la studii atunci fi efectul placebo cand participantii realizeaza ca pot fi distribuiti in grupul care nu primeste niciun fel de tratament Se observa un numar mai mare de refuzuri pentru a fi evaluati la nivel de posttest Creste potentialul de risc la nivelul validitatii de construct a rezultatelor obtinute Grup cu interventie amanata (waiting list group) Se verifica daca Poate fi aplicata doar in anumite situatii interventia are un (nu in situatii acute care necesita efect interventii imediate, deoarece ar ridica Cei din grupul de control primesc interventia doar la finalul derularii cercetarii (posttest finalizat), uneori chiar dupa finalizarea perioadei de urmarire (follow-up finalizat) aceleasi probleme etice ca si in conditiile absentei interventiei) Daca implementarea interventiei in grupul de control se realizeaza dupa evaluarea de la nivel de posttest, nu mai pot fi analizate efectele din perioada de urmarire (follow-up) Se observa un numar mai mare de refuzuri de participare la studiu, ce creste cu cat perioada de asteptare este una mai lunga Durata mai lunga (dubla) de derulare a studiului Grup cu interventie nespecifica (placebo sau nespecific intervenitori) Cei din grupul de control primesc o interventie, pe care clientii o percep ca fiind credibila (utila) pentru problema lor, dar care nu se bazeaza pe factorii Se verifica daca interventia vizata este responsabila pentru efectul obtinut si nu alte aspecte nespecifice precum (efectul activi vizati placebo, alti factori comuni, nespecifici etc ) Grup cu interventie uzuala (usual care) Cei din grupul de control urmeaza procedurile existente la momentul respectiv Se verifica daca interventia vizata este mai buna decat cea uzuala Obtinerea unor diferente semnificative intre grupul experimental si cel de control ar oferi doar siguranta ca nu factorii comuni placebo sunt responsabili pentru efectul observat, dar nu vor oferi detalii despre care element specific este responsabil pentru efectul observat Dificultatea de a dezvolta interventii care sa fie percepute de participanti drept actiuni credibile pentru inlaturarea problemei constatate Solutie, uneori discutabila din punct de vedere etic Cresterea numarului de participanti la studiu, deoarece marimea efectului este mai mica daca se compara tratamentul activ cu cel de tip placebo decat daca se compara interventia activa cu "absenta interventiei" sau cu "lista de asteptare" Preferabila etic in fata solutiilor mentionate anterior deoarece si grupul de control beneficiaza de o interventie activa Ceea ce se intelege prin interventie uzuala poate varia de la o situatie la alta, chiar pentru aceeasi problema De exemplu, pentru reducerea absenteismului, o scoala poate avea implementata o strategie clara bazata pe discutii cu parintii si cu psihologul scolar, in timp ce o alta scoala apeleaza uzual la o discutie intre diriginte si elev, urmata de informarea telefonica a parintilor Rezultatele studiului ar fi astfel dependente de locatia unde s-ar derula studiul Exista un nivel mai scazut de standardizare in implementarea (aplicarea) procedurilor implicate in interventia uzuala, fapt ce poate afecta increderea in validitatea comparatiei realizate Cresterea numarului de participanti comparativ cu cazul primelor doua tipuri de grupuri de control ("absenta tratamentului sau asteptarea") Grup cu interventie recomandata (goldan standard treatment group) Se verifica daca interventia vizata este mai buna, cel Cei din grupul de control urmeaza interventia care la momentul respectiv este recunoscuta ca fiind cea mai putin egala sau macar nu este inferioara Necesita cel mai ridicat numar de participanti, comparativ cu celelalte strategii prezentate anterior, deoarece marimile efectului privind diferentele dintre cele doua grupe au deseori valori scazute intalnita si mai eficienta forma de actiune pentru problema avuta interventiei considerate la momentul respectiv ca fiind cea mai Este considerata a fi cea mai dezirabila solutie din punct de vedere etic eficienta sau cea mai raspandita solutie Strategia aditiva Cazul este intalnit atunci cand grupul experimental beneficiaza de o interventie activa suplimentara (de exemplu, terapie, in plus fata de medicatie), iar performanta se compara implementarea unei Se verifica daca interventia adaugata (combinata) poate aduce un beneficiu suplimentar (incremental) fata de Necesita un numar ridicat de participanti, deoarece castigul adaugat de un eventual al doilea element activ nu este la fel de mare ca si diferenta existenta atunci cand comparam cazul aplicarii unui element activ cu absenta oricarui element activ Necesita mai multe resurse pentru a putea cu un grup de "control" care primeste doar medicatie interventii singulare fi implementata Poate fi implementata doar daca in prealabil au fost colectate dovezi cu privire la eficienta interventiilor singulare sau daca se asteapta ca una dintre strategii sa potenteze efectul celeilalte (sa joace un rol moderator) Strategia derivativa Se verifica ce modificari in in acest caz nu se poate vorbi propriu-zis de un grup de control, deoarece ambele grupe primesc: (a) fie acelasi tip de interventie in gradiente diferite (expunere la stimul! timp de 10 minute interventie pot conduce la cresterea eficientei acesteia Se analizeaza care in absenta introducerii unui grup de control , acest tip de design necesita cel mai mare numar de participanti pentru a asigura o putere statistica optima in testarea ipotezelor Are avantajul de a trece dincolo de simpla discutie despre prezenta sau sau 30 de minute); (b) fie forme variate componente din ale aceluiasi tip de interventie (terapie cognitiv-comportamentala centrata pe combaterea cognitiilor irationale asociate tolerantei scazute la frustrare vs asociate autodeprecierii) cadrul interventiei sunt responsabile pentru efectul observat Cum poate fi optimizata interventia? absenta unei relatii de tip cauza-efect spre a oferi explicatii cu privire mecanismele cauzale implicate (mecanismele schimbarii) Desigur, poate fi implementata doar dupa ce exista deja dovezi cu privire la eficienta interventiei analizate, la nivel global (molar) intreaga discutie mentionata anterior porneste de la premisa necesitatii existentei unui grup de control, pentru a putea analiza daca eventualele modificari observate la nivelul grupului experimental sunt cauzate de variabila independenta manipulata in absenta unui asemenea grup comparativ, nu vom putea determina daca modificarile sunt cauzate de acesti factori sau de alti factori care ar putea intra in categoria variabilelor confundate (vezi si sectiunea destinata riscurilor la nivelul validitatii interne din capitolul 3) De exemplu, stabilirea eficientei terapiei cognitiv-comportamentale in ameliorarea simptomatologiei asociate enurezisului prin apelul la un design cu un singur grup pretest-posttest, fara grup de control, nu poate fi stabilita deoarece eventualele ameliorari observate pot fi cauzate atat de interventia in sine, cat si de procesul normal de maturare (reducerea simptomatologiei pe masura inaintarii in varsta) La fel de important de retinut este si influenta diferentiata pe care o are tipul de grup de control asupra validitatii concluziilor unui studiu De exemplu, alipirea unui grup de control de tipul absentei tratamentului va permite eliminarea explicatiei alternative conform careia maturarea ar fi elementul responsabil, deoarece atat grupul experimental, cat si cel de control trec prin aceleasi conditii insa un asemenea design nu ar putea permite unui autor sa afirme ca reducerea cognitiilor irationale ar fi responsabila pentru ameliorarea simptomatologiei deoarece nu a existat un grup de control activ (placebo, interventie uzuala) care sa elimine impactul factorilor comuni (nespecifici) De asemenea, nu s-ar putea valida nici afirmatii cum ar fi: (a) terapia respectiva este cea mai eficienta solutie pentru combaterea enurezisului (in lipsa unor grupuri de control active precum grupurile de interventie recomandata); (b) terapia ar trebui utilizata ca tratament adjuvant la medicatie (atat timp cat nu exista dovezi ca actiunea lor combinata ar fi mai eficienta decat utilizarea exclusiva a tratamentului medicamentos) 4 2 Studiile randomizate controlate in situatia in care studiile experimentale sunt utilizate in contexte specifice cercetarii pentru a raspunde la intrebari precum: (a) "este interventia X una eficienta?"; (b) "care componenta a interventiei X este responsabila pentru eficienta interventiei (care este mecanismul schimbarii)?"; (c) "este interventia X la fel de eficienta in cazul scolarilor mici precum in cazul liceenilor?" etc , solutia metodologica potrivita este aceea de a realiza studii randomizate controlate (randomized controlled trial) Desi cele mai multe studii randomizate controlate sunt efectuate in domeniul stiintelor medicale, aplicabilitatea lor este extinsa la o sfera mult mai larga de domenii, precum domeniul clinic al psihoterapiei dominant in psihologie, cel educational, domeniul juridic, domeniul organizational, domeniul politicilor publice etc Din perspectiva paradigmei oricarei stiinte validate stiintific (aspectul principal analizat in lucrarea de fata), aceste studii sunt esentiale, deoarece au cel mai ridicat nivel de validitate interna, prin urmare concluziile acestor studii prezinta cel mai scazut risc de a fi distorsionate in titulatura acestui gen de studii se regasesc sintagmele "randomizate", respectiv "controlate", acestea fiind specifice oricarui studiu experimental in consecinta, aspectele discutate in sectiunile anterioare ale acestui capitol se aplica si pentru acest tip particular de studii experimentale in plus, o serie de amanunte specifice studiilor randomizate controlate au fost conceptualizate (vezi standardele CONSORT, Schulz et al , 2010; Moher et al , 2010) si merita discutate in continuare, in ideea facilitarii implementarii acestui gen de studii in spatiul romanesc Prima idee care ar trebui retinuta in legatura cu studiile randomizate controlate este aceea ca sub umbrela acestei expresii intra o varietate de studii, a caror clasificare sintetica dupa criterii variate se regaseste in figura 4 4 Control strict (studii cauzale) -"Efficacy studies" Control relaxat (studii pragmatice) - Effectiveness studies" Criteriu: nivelul dc control al variabilelor straine Grupe paralele Grupe incrucisare iX-sipn lactorial Criteriu: designul utilizat Demonstrarea relatiei de tip cauza-efect Clasificarea studiilor randomizate controlate Criteriu: unitatea randomizata Criteriu: transparenta interventiei primite Da studiu deschis Clusier (grupul natural) Nu studiu placebo Rmicipantul identificarea mecanismelor schimbarii Analiza cost-eficienta  cost-utilitate Criteriu: obiectiv major vizat Criteriu: scopul comparatiei Criteriu: momentul random i zarii inaintea obtinerii consimtirii informate (Metoda Zeleni Echivalenta interventiei Non inferioritatea interventiei Dupa obtinerea consimtirii ale   St ii irci Superioritatea interventiei Figura 4 4 Clasificarea studiilor randomizate controlate dupa criterii variate O scurta descriere a elementelor mentionate in figura 4 4 se regaseste in tabelul urmator, cu mentiunea ca o detaliere a diferentelor cele mai importante dintre diferitele tipuri de studii randomizate este prezentata in sectiunea 4 2 1, in care sunt descrise pe larg etapele unui prototip de studiu randomizat controlat Tabelul 4 4 Descrierea succinta a aspectelor mentionate in figura 4 4 Criteriu: nivelul de control al variabilelor straine • Studiile cauzale (efficacy studies) au drept caracteristica un control strict al tuturor variabilelor straine la toate nivelurile (in selectarea participantilor eligibili in cadrul studiilor; in monitorizarea aplicarii intr-o maniera integra a interventiei; in selectarea variabilelor dependente primare etc ) Prin aceste masuri asiguratorii se are in vedere obtinerea unei validitati interne ridicate pentru concluziile studiului, fapt ce permite inclusiv identificarea unor relatii de tip cauza-efect si sau a mecanismelor schimbarii implicate • Studiile pragmatice (effectiveness studies) au drept caracteristica un control mai relaxat al unor variabile importante pentru studiu, in ideea replicarii situatiilor din realitate Astfel, in studiile pragmatice, criteriile de eligibilitate pentru selectarea participantilor sunt mai putin stricte si se accepta devieri fata de cele specificate in protocolul de implementare a interventiei, iar variabilele dependente selectate sunt cele importante relevante pentru societate individ (de obicei, aspecte comportamentale) Prin aceste masuri asiguratorii se are in vedere indeosebi obtinerea unei validitati externe (ecologice) ridicate Dat fiind specificul celor doua tipuri de studii, studiile cauzale ar trebui sa preceada temporal studiile pragmatice, acestea din urma avand sens doar daca in primele se identifica o relatie de tip cauza-efect Mai multe detalii despre diferentele dintre aceste tipuri de studii sunt prezentate in sectiunea 4 2 1 Criteriu: designul utilizat • Designul de baza cu grupe paralele (parallel groups sau parallel arms) reprezinta, de departe, cel mai frecvent design intalnit in studiile randomizate controlate, constand in compararea a doua sau mai multe grupe diferentiate la nivelul modalitatilor variabilei independente (de exemplu, compararea terapiei rational-emotive, cu un grup de control de tipul listei de asteptare privind ameliorarea simptomatologiei depresive) Modelul standard de lucru intr-un design cu grupe paralele presupune: (a) verificarea eligibilitatii participantilor la studiu, cu ocazia evaluarii la nivel de pretest; (b) randomizarea participantilor in grupe si aplicarea interventiei (pentru grupul experimental); (c) evaluarea si compararea efectelor aplicarii, respectiv neaplicarii interventiei la momentul postinterventie; (d) evaluarea si compararea efectelor interventiei la finalul perioadei de urmarire (follow-up) • Designul de baza cu grupe incrucisate (cross-over design groups arms) reprezinta o extensie a modelului cu grupe paralele, prin faptul ca dupa realizarea primilor trei pasi (dupa masurarea si compararea efectelor observate la grupul experimental, respectiv cel de control, de la momentul postinterventie), cele doua grupe isi schimba rolul, astfel incat interventia activa este aplicata asupra fostului grup de control, in timp ce fostul grup experimental devine grupul de asteptare (de control) Acest design este rar intalnit in domeniul stiintelor sociale din cauza efectului de reportare (carry-over), a prelungirii duratei cercetarii sau a renuntarii de a studia efectele la finalul perioadei de urmarire (follow-up) • Designul factorial (factorial design) reprezinta cazul in care grupele studiului sunt alcatuite in baza combinarii a doua (cel mai adesea) sau mai multe variabile independente Un exemplu in acest sens ar fi un studiu in care se urmareste daca un program de consiliere psihologica ar fi eficient in a-i determina pe adulti sa renunte la fumat, in contextul in care se doreste a se tine seama si de eficienta deja dovedita a plasturilor cu continut de nicotina Din incrucisarea celor doua variabile independente rezulta patru celule experimentale posibile: participanti care vor primi atat consiliere psihologica, cat si tratament farmaceutic prin aplicarea de plasturi; participanti care vor beneficia doar de consiliere psihologica; participanti care vor primi doar tratament farmaceutic si participanti aflati in grupul de control (fara interventie) Avantajul designului factorial fata de celelalte tipuri de design consta in posibilitatea de a studia efectul de interactiune dintre cele doua tipuri de interventii Dezavantajul consta in consumul ridicat de resurse si in necesitatea identificarii mai intai a doua forme diferite de interventie posibile (eficiente), aspecte care fac ca acest tip de design sa fie mai rar intalnit comparativ cu designul bazal cu grupe paralele Criteriu: obiectivul major al studiului • Demonstrarea unei relatii de tip cauza-efect este cel mai frecvent obiectiv intalnit in cadrul studiilor randomizate controlate, primele intrebari fiind adesea: "Este aceasta interventie eficienta? Se poate spune ca exista o relatie de tip cauza-efect intre expunerea la X si aparitia efectului Y?" Acest tip de obiectiv poate fi atins prin acordarea unei atentii deosebite aspectelor de validitate interna ale unei cercetari, de aceea el este atins prin studii cauzale (vezi primul criteriu) • identificarea mecanismelor schimbarii reprezinta un alt obiectiv important ce este adresat prin intermediul studiilor randomizate controlate, aceasta intrebare fiind pusa dupa demonstrarea unei relatii de tip cauza-efect Prin intermediul acestui obiectiv se vizeaza raspunsuri la intrebari de genul: "Ce componenta a interventiei ce anume din interventie a condus la aparitia unei relatii de tip cauza-efect?", "Care este elementul activ?", "Ce aspecte din cadrul interventiei sunt responsabile pentru aparitia unei relatii de tip cauza-efect?" Acest tip de obiectiv poate fi atins doar prin intermediul unei forme particulare de studii cauzale (efficacy studies), pe care am etichetat-o in capitolul 3 ca cercetare de tip cauzal-explicativ • Din perspectiva unei abordari validate stiintific, dupa demonstrarea unei relatii de tip cauza-efect (este interventia eficienta?), dupa identificarea mecanismelor schimbarii responsabile (de ce interventia este una eficienta?) se poate stabili daca interventia are un raport cost-eficienta sau cost-utilitate pozitiv (cat de rentabila este interventia?) Desi acest tip de intrebare poate fi abordat prin designuri de cercetare multiple (inclusiv de tip non-experimental), cel mai potrivit design este cel experimental (preferabile de aceasta data fiind studiile pragmatice, pentru a evidentia costurile si efectele obtinute intr-un context cat mai apropiat de realitate, in conditiile mentinerii unui control asupra unor potentiale variabile straine) Criteriu: transparenta interventiei primite • Studiile care includ conditia placebo (placebo sham studies) reprezinta standardul de lucru in domeniul stiintelor medicale Acest lucru presupune mascarea interventiei active, prin intermediul unor interventii nespecifice (neactive), cat mai apropiate de interventia activa pentru a elimina anumite distorsiuni posibile care apar in contextul in care participantii cunosc faptul ca nu sunt inclusi in grupul experimental activ (vezi efectul Hawthorne sau efectele de demoralizare cu consecinte negative, inclusiv la nivelul cresterii procentului de renuntare la studiu din randul participantilor inclusi in grupele inactive) Pentru a potenta efectele pozitive, studiile care tin seama de efectul placebo ar trebui sa apeleze la o masura suplimentara de siguranta Ar fi indicat nu numai ca participantul sa nu cunoasca exact grupul din care face parte, ci si cei care implementeaza studiul (aplica interventia) sau efectueaza evaluarile pentru a detecta prezenta sau absenta unui efect sa nu stie din ce grup face parte un participant Daca mascarea grupului de apartenenta este posibila pentru toate cele trei categorii de actori vorbim despre un design triplu-orb, daca mascarea este posibila doar pentru doua categorii de actori avem un design dublu-orb in contextele specifice domeniului psihologiei este destul de greu sa se implementeze studii de tip placebo (design orb pentru participanti) sau designuri cu un nivel de mascare mai complexa (deoarece, spre exemplu, psihoterapeutul sau trainerul trebuie sa stie ce fel de interventie sa aplice asupra unei persoane anume) Totusi, in cazul studiilor din sfera psihologiei este posibila mascarea pentru o categorie de actori, aceia care realizeaza evaluarile, masurand efectele produse de interventie la diferite intervale de timp Acest lucru este necesar mai ales daca masurile colectate au un caracter subiectiv (observatii), caz in care cunoasterea grupului caruia ii apartine o anumita persoana ar putea conduce la aprecieri distorsionate, care sa favorizeze efectul interventiei • Studiile deschise (transparente) (open studies) reprezinta acele situatii experimentale in care toti participantii implicati activ (participanti, traineri, evaluatori) cunosc carui grup ii apartine fiecare persoana inclusa in studiu in acest gen de studii, pentru a reduce eventualele distorsiuni legate de mentinerea unora dintre participanti in grupe inactive, ar fi preferabil sa se utilizeze grupe de control active (interventii uzuale, interventii recomandate comparative) O alta solutie recomandabila ar fi aceea de a selecta drept variabile dependente principale masuri fiziologice sau comportamentale care sa fie mai putin susceptibile la distorsiune comparativ cu masurile de tip autoraportare (self-report) sau hetero-raportare (peer-report), mai ales daca grupul de control este unul de tip inactiv (fara interventie sau lista de asteptare) in sfarsit, o alta recomandare ar fi sa se ia in considerare preferintele participantilor si sa se analizeze impactul acestora in rezultatele finale (efectul observat la participantii distribuiti in grupul A la cei care preferau sa fie distribuiti in aceasta interventie comparativ cu efectul participantilor din grupul A care ar fi preferat sa fie distribuiti in grupul B) Criteriu: unitatea supusa randomizarii • individul reprezinta solutia standard de lucru in studiile randomizate controlate Astfel, randomizarea participantilor la studiu in conditiile experimentale se face individual, aceasta fiind solutia preferabila ori de cate ori este posibil acest lucru, pentru a asigura un control strict al variabilelor straine care tin de caracteristicile indivizilor inclusi in studiu Detalii suplimentare despre acest tip de studiu vor fi prezentate in continuarea acestei sectiuni • Grupul natural reprezinta solutia alternativa de alocarea randomizata a indivizilor in conditiile experimentale, atunci cand nu este fezabila randomizarea la nivel individual Acest nivel de randomizare poarta denumirea de randomizare cluster Pentru a fi la fel de eficienta precum randomizarea la nivel de individ, randomizarea la nivel de cluster trebuie sa respecte cateva conditii, discutate in sectiunea 4 2 2 Acest gen de randomizare este uneori singura solutie (de exemplu, in medii organizationale sau scolare unde s-ar putea obtine cu greu acceptul de a redistribui echipele de munca clasele de elevi) in acest context, elementele randomizate vor fi clasele echipele din care participantii fac parte in mod natural Avantajul acestui tip de randomizare in conditiile lucrului in medii cu grupuri naturale gata formate (departamente, clase etc ) este acela de a impiedica diseminarea informatiei din grupurile active si de a reduce efectele de tip Hawthorne sau cel de demoralizare demotivare) Detalii despre randomizarea la nivel de cluster gasiti in sectiunea 4 2 2 Criteriu: momentul randomizarii • Modalitatea standard de lucru intr-un studiu randomizat controlat este aceea de a aloca aleatoriu participantii eligibili in grupele experimentale dupa ce acestia au citit in prealabil informatii despre studiu si au consimtit sa participe la studiu, fara a avea dreptul de a alege grupa experimentala in care vor fi distribuiti Aceasta varianta este atat de frecvent intalnita, incat nici nu are o titulatura specifica, fiind, de altfel, varianta preferabila si din punct de vedere etic Problema identificata cu acest tip de design este aceea ca el nu ia in considerare impactul preferintelor participantilor (desi in general efectul unei interventii tinde sa fie mai ridicat in cazul pacientilor atrasi de interventia respectiva si mai scazut in cazul celor care au o opinie nefavorabila fata de interventia respectiva) Alocarea randomizata nu rezolva intotdeauna aceasta problema De exemplu, in cazul reducerii durerii postoperatorii este posibil ca majoritatea participantilor sa prefere apelul la farmacoterapie (din motiv de timp sau confort) decat sa fie distribuiti intr-un grup de psihoterapie, iar aceasta inegalitate in preferinte poate afecta validitatea interna a rezultatelor obtinute • Metoda alternativa de lucru, cunoscuta sub denumirea de metoda Zelen (apud Torgerson si Torgerson, 2008), presupune randomizarea participantilor in grupele studiului inainte de a cere acceptul acestora de a participa la studiu Pentru a considera aceasta solutie acceptabila din punct de vedere etic (in contextul in care participantii nu cunosc faptul ca au fost alocati aleatoriu anterior, fara acceptul lor), ea poate fi utilizata in contexte in care grupul de control primeste un tratament activ (cel putin interventia uzuala sau interventia standard recomandata) in varianta simpla a metodei Zelen, doar participantii inclusi in grupul care primeste interventia inovativa sunt chestionati cu privire la preferinta lor, iar cei care se declara impotriva tratamentului inovativ sunt inclusi in grupul de control (beneficiar al interventiei recomandate uzuale) in varianta dubla, prin metoda Zelen sunt chestionate ambele categorii de indivizi, atat cei alocati grupului experimental, cat si cei alocati grupului de control, urmand ca participantii care ar prefera celalalt tratament existent sa fie realocati conform preferintei lor Un aspect tehnic important legat de aceste proceduri, pentru a mentine studiul in categoria studiilor randomizate, este faptul ca analiza statistica a rezultatelor se face tinand cont de recomandarile strategiei intentiei de a trata (intention to treat) (vezi sectiunea 4 2 3) in cazul de fata, acest lucru inseamna ca rezultatele celor doua grupe sunt analizate pornind de la compozitia initiala a grupelor in urma randomizarii De exemplu, indivizii care au fost realocati pentru a primi interventia B datorita preferintei lor, vor fi analizati ca facand parte din grupul A, unde fusesera initial repartizati aleatoriu, in baza strategiei bazata pe intentia de a trata Desigur, o asemenea solutie este posibila daca numarul celor realocati in total intre grupe nu este unul ridicat (sub 10-15%), altfel fiind afectate concluziile finale din cauza mixarii interventiilor O alternativa posibila in analiza datelor provenite dintr-un studiu ce apeleaza la metoda Zelen este analiza standard a datelor, dublata de efectuarea unor analize suplimentare cu referire la impactul pe care preferinta participantilor pentru o anumita interventie il joaca asupra rezultatelor finale Criteriu: scopul comparatiei • Demonstrarea superioritatii unei interventii (grupul experimental) in fata grupului de control este varianta tipica intalnita in studiile randomizate controlate, fiind extrem de raspandita Scopul ei este de a urmari in ce masura o interventie poate fi considerata a fi semnificativ mai eficienta decat alte solutii supuse compararii Absenta unui rezultat semnificativ statistic in urma compararii unor interventii, fie ele A si B, nu inseamna automat ca cele doua interventii sunt echivalente sau ca se afla intr-o relatie de non-inferioritate una fata de cealalta • Demonstrarea echivalentei dintre doua interventii se intalneste atunci cand o interventie noua este comparata cu o interventie a carei eficienta a fost demonstrata, pentru a arata ca ambele au un nivel similar de eficienta Demonstrarea non-inferioritatii unei interventii este utilizata atunci cand se doreste a se arata ca o interventie noua nu este mai putin eficienta (inferioara) unei interventii consacrate pentru problema respectiva in ambele cazuri se defineste un interval marginal (o diferenta A considerata ca fiind maximumul distantei posibile dintre doua interventii care nu are un impact practic [clinic] - de exemplu, marimea efectului de intensitate mica) Spre ilustrare, doua interventii sunt considerate echivalente in tratamentul depresiei daca diferentele sesizate nu sunt semnificative statistic si daca ele se regasesc in intervalul stabilit anterior (de exemplu, o diferenta de ±2 puncte intre mediile celor doua grupe comparate la o proba care evalueaza nivelul depresiei) Transpus in termeni de non-inferioritate, am spune despre o interventie menita sa combata depresia ca ea este non-inferioara alteia consacrate, daca diferenta dintre medii nu este semnificativa statistic si daca nivelul mediu al depresie din grupa care a beneficiat de interventia experimentala nu este mai mic de 2 puncte fata de nivelul mediu al depresiei din grupul care a primit interventia standard (recomandata) Asadar, echivalenta se transpune in termenii unei ipoteze bilaterale, in timp ce non-inferioritatea este specifica unor ipoteze unilaterale in cazul demonstrarii echivalentei non-inferioritatii unei interventii noi, comparativ cu interventia standard, noua interventie poate deveni prima optiune solutie daca ea poseda alte caracteristici superioare (cum ar fi costuri mai reduse, acceptabilitate mai ridicata din partea beneficiarilor, durata mai redusa de implementare, aria de diseminare mai larga etc ) Mai multe detalii privind implicatiile metodologice pentru studii randomizate controlate ce vizeaza demonstrarea echivalentei non-inferioritatii unei interventii fata de un alt tratament activ (recomandat) sunt disponibile in Piaggio et al (2006) Desi numarul posibilitatilor de a combina diferitele caracteristici ale studiilor randomizate controlate este unul nelimitat, cel mai intalnit design de acest gen in domeniul psihologiei este cel al unui (a) studiu cauzal (efficacy study) (b) cu un design bazal cu doua grupe paralele, (c) deschis sau simplu-orb (prin mascarea apartenentei la grupe in fata asistentilor de cercetare care masoara evolutia variabilelor dependente), (d) ce urmareste demonstrarea unei relatii de tip cauza-efect, aspect caruia i se adauga uneori identificarea mecanismelor schimbarii (e) si in care alocarea randomizata a participantilor in grupe se face la nivel individual, (f) ulterior obtinerii consimtirii informate din partea participantilor Din aceste motive, in sectiunea urmatoare a acestui capitol, vom detalia etapele realizarii unui asemenea studiu-prototip, oferind insa specificatii paralele suplimentare cu rol comparativ pentru situatia studiilor pragmatice (effectiveness) 4 2 1 Etapele derularii unui studiu randomizat controlat Pentru a structura continutul acestei sectiuni, vom apela la reprezentarea grafica a unui studiu randomizat controlat, conform standardelor CONSORT (Moher et al , 2010), care are in vedere etapele acestui proces: (a) recrutarea si selectarea participantilor (enrollment); (b) alocarea randomizata a participantilor si derularea interventiilor; (c) urmarirea evolutiei acestora (follow-up); (d) analiza statistica a rezultatelor 4 2 1 1 Etapa de recrutare si selectie a participantilor Aparent, aceasta etapa pare una mai facila, cel putin comparativ cu celelalte etape implicate intr-un studiu randomizat controlat in realitate, insa, nu mai putin din 54% dintre studiile de acest gen au apelat la o extindere a perioadei de recrutare pentru a-si atinge numarul dorit de participanti eligibili, iar 45% dintre studii s-au derulat cu un numar de participanti sub nivelul a 80% din numarul estimat (dorit) initial (McDonald et al , 2006) Figura 4 5 Diagrama etapelor existente in implementarea unui studiu randomizat controlat cu doua grupe paralele, cu un grup de control activ - interventie uzuala O recrutare de succes este aceea care reuseste sa stranga in intervalul de timp prestabilit numarul de persoane eligibile pentru a primi interventia, asa cum s-a estimat initial pentru a asigura o putere statistica optima de a detecta efectul interventiei asupra variabilei dependente principale (primary outcome) in demersul de recrutare se poate apela la orice mijloc de promovare a studiului, de la publicitatea efectuata in mass-media locala la extinderea numarului de locatii (institutii colaboratoare care implementeaza studiul) si la oferirea de stimulente financiare care sa fie acceptabile din punctul de vedere al comitetului de etica a cercetarii De exemplu, in SUA, plata acordata direct participantilor eligibili pentru a fi inclusi in studiu este considerata adecvata doar daca se rezuma la a acoperi unele cheltuieli ale acestora (cum ar fi cele de deplasare), avantajul constand mai degraba in oferirea interventiei in regim gratuit Recomandabil ar fi insa sa fie motivati financiari alti specialisti (de exemplu, profesori, medici etc ) care sa ajute la identificarea cazurilor potential eligibile (Torgerson si Torgerson, 2008) O alta solutie ingenioasa, de interes pentru organizatiile orientate spre profit, ar fi aceea de a scrie direct angajatorilor propunandu-li-se acestora realizarea de parteneriate (acestia sa indemne cointereseze angajatii sa participa la studii) daca problema vizata va duce la o reducere a cheltuielilor de sanatate (crestere a profitului), cum ar fi cazul programelor destinate reducerii fumatului sau reducerii stresului la locul de munca (Lando, 1982) Participantii identificati ca fiind potential eligibili sunt evaluati initial pentru a determina daca ei indeplinesc intr-adevar criteriile de includere in studiu, respectiv daca nu intra sub incidenta unor criterii de excludere Aceste criterii sunt stabilite a priori, fiind mai restrictive in cazul studiilor cauzale decat in cazul celor pragmatice Desigur, indicat ar fi sa fie luate in considerare doar acele criterii de includere excludere care au relevanta pentru obiectivul cercetarii, astfel incat sa nu fie afectata validitatea interna (pe de o parte - vezi cazul studiilor cauzale), dar si sa fie potentata validitatea externa a studiului (capacitatea de generalizare a concluziilor - vezi cazul studiilor pragmatice) Un alt rol al acestei evaluari initiale este de a colecta rezultatele participantilor la studiu la momentul preinterventiei (pretest), ce vor fi utilizate ulterior in analizele statistice Un aspect important de mentionat cu privire la aceasta etapa este aspectul temporal Astfel, in multe cazuri, etapa de recrutare si selectie se realizeaza integral inaintea inceperii studiului, asa cum este prezentata si situatia din figura 4 5 Totusi, in studiile in care este nevoie de multi participanti sau in care participantii sunt greu de gasit, o solutie posibila este aceea de a suprapune etapa de recrutare cu etapele ulterioare de derulare a studiului, caz in care vorbim de o recrutare secventiala (de exemplu, este posibil ca la momentul recrutarii ultimilor participanti necesari pentru studiu, primii indivizi recrutati sa fie deja in perioada de urmarire [follow-up]) Ceea ce este important in aceste cazuri este ca interventia sa aiba o durata si activitati standard si sa existe un procent relativ egal de persoane distribuite in grupul experimental, respectiv de control, intr-o anumita etapa, astfel incat sa fie controlate eventuale efecte sezoniere sau efecte ce tin de instrumentare (variatii in familiarizarea cu sarcina) Caseta 4 4 ilustrarea unor criterii de includere excludere in cazul ipotetic al unui studiu randomizat controlat care urmarea impactul psihoterapiei in combaterea depresiei majore A Studiu cauzal Participantii eligibili sunt cei: (a) cu varste cuprinse intre 18 si 65 de ani; (b) care au fost diagnosticati ca avand tulburare depresiva majora conform standardelor DSM iV; (c) care nu prezinta alte comorbiditati psihiatrice; (d) care obtin un scor de cel putin 20 la proba de depresie Beck; (e) care nu sunt implicati in vreo alta forma de tratament pentru ameliorarea simptomatologiei depresive; (f) care se afla la primul episod depresiv diagnosticat B Studiu pragmatic Participantii eligibili sunt cei: (a) cu varste cuprinse intre 18 si 65 de ani; (b) diagnosticati cu tulburare depresiva majora conform standardelor DSM iV; (c) care nu sunt implicati in vreo alta forma de tratament pentru ameliorarea simptomatologiei depresive Participantii care in urma evaluarii initiale indeplinesc conditiile de eligibilitate sunt solicitati sa semneze un formular de consimtire informata pentru a putea fi inclusi in studiu, acest procedeu fiind necesar pentru a indeplini standardele etice in derularea cercetarilor Desi formatul unui formular de consimtire informata poate varia de la un studiu la altul, in continutul ideatic al acestuia ar trebui sa se regaseasca, indiferent de tipul studiului (experimental, non-experimental etc ), descrieri ale: (a) obiectivului cercetarii; (b) duratei studiului, in special ale duratei de implicare activa a participantului la studiu; (c) procedurilor si sarcinilor care vor trebui urmate (inclusiv ale faptului ca participantii vor fi alocati aleatoriu in grupele experimentale, cu descrierea specificului fiecarui tip de interventie si a evaluarilor care vor fi facute); (d) potentialelor riscuri existente prin expunerea la interventia oferita (implicarea in cercetare); (e) eventualelor beneficii rezultate din participarea la studiu (altele decat stimulentele financiare academice); (f) stimulentelor financiare academice (de exemplu, credite suplimentare, scutiri de sarcini, bonus in notare), daca acestea vor fi acordate, cu precizarea explicita a faptului ca acestea nu sunt conditionate de completarea integrala a sarcinilor prevazute in studiu renuntarea pe parcurs la studiu; (g) modului in care va fi asigurata confidentialitatea datelor si, daca este cazul, solicitarea permisiunii de a utiliza unele materiale colectate (fotografii, inregistrari audio) in scop de cercetare; (h) drepturilor participantului la studiu (de a completa doar sarcinile portiuni din sarcini in care consimte voluntar, de a se retrage pe parcursul studiului fara a fi penalizat sau a pierde vreun beneficiu castigat pana atunci; de a cere asistenta gratuita in cazul in care procedurile experimentale i-au creat un disconfort o problema de sanatate); (i) datelor de contact (telefon,  , adresa postala) ale coordonatorului studiului sau ale persoanei desemnate sa raspunda la orice problema intrebare pe care o au, precum si a datelor de contact ale unei instante superioare, in cazul in care nu sunt multumiti de modul in care le-au fost solutionate cererile de catre coordonatorului studiului persoana de contact desemnata; (j) declaratiei-tip a participantului, cu spatiu pentru a trece olograf numele, semnatura si data, in care se specifica faptul ca formularul a fost citit, iar participantul este de acord cu aspectele specificate Acest formular este redactat in doua exemplare, cate unul de fiecare parte (participant, respectiv echipa de cercetare), fiind de asemenea semnat de catre coordonatorul studiului Kazdin (2010), unul dintre cei mai mari specialisti in domeniul metodologiei cercetarii in psihologie clinica si psihoterapie, recomanda ca formularul de consimtire informata sa aiba urmatoarele sectiuni subtitluri: (a) privire de ansamblu asupra studiului (overview); (b) descrierea procedurilor studiului; (c) riscuri; (d) beneficii; (e) stimulente; (f) confidentialitate; (g) interventii alternative disponibile catre client (in afara studiului); (h) acordul voluntar - un paragraf cu acordul voluntar al participantului la studiu; (i) date de contact pentru intrebari si informatii suplimentare; (j) semnaturi Un exemplu concret de formular de consimtire informata, folosit intr-un studiu clinic controlat realizat in Romania, este prezentat in caseta 4 5 Caseta 4 5 Un model de formular de consimtire informata utilizat intr-un studiu randomizat ACORD DE PARTiCiPARE LA CERCETARE NUMELE CERCETaRii (STUDiULUi) Rolul psihoterapiei cognitiv comportamentale in tratamentul chirurgical parodontal: un studiu clinic controlat (PSiDENT) CONSiMtaMaNT iNFORMAT Va rugam sa cititi cu atentie acest formular si sa intrebati coordonatorul studiului sau membrii echipei de cercetare a studiului orice informatie pe care nu ati inteles-o clar Va rugam sa va asigurati ca toate intrebarile dvs au fost clarificate inainte sa semnati formularul informatia obtinuta din acest formular si din discutiile cu membrii echipei de cercetare va poate ajuta sa va decideti daca doriti sa participati in acest studiu de cercetare Daca optati sa participati, trebuie sa va scrieti numele si sa semnati la sfarsitul formularului si pe autorizarea de participare la cercetare iNTRODUCERE Studiul la care sunteti invitat sa participati urmareste sa evalueze eficienta interventiilor chirurgicale parodontale versus combinatia intre interventiile chirurgicale parodontale si interventia psihologica cognitiv-comportamentala in tratamentul persoanelor cu boala parodontala sau retractii gingivale izolate Este important sa stiti ca: (1) participarea la studiu este voluntara; (2) puteti decide sa nu luati parte sau puteti sa va retrageti din studiu in orice moment in oricare caz, nu veti pierde niciun beneficiu la care aveti altfel dreptul insa, pentru a primi gratuit tratamentul prevazut in studiu trebuie sa acceptati participarea in studiu DESCRiEREA STUDiULUi A ELiGiBiLiTATE Pot participa la studiu persoane cu varste intre 14-60 de ani, in buna stare de sanatate generala, care prezinta: kuna sau mai multe retractii gingivale (RG) > 2mm, clasa 1, 2 sau 3 Miller, fara interventii muco-gingivale anterioare in zona vizata sau ► parodontite cronice sau agresive, care necesita un tratament chirurgical de reducere a pungilor parodontale Criteriile de excludere se refera la: persoanele cu afectiunile sistemice care contraindica interventia chirurgicala, mobilitate dentara de gradul 3 sau 4, motivatie insuficienta B PROCEDURa Bazat pe acordul dvs voluntar si verificarea prealabila a eligibilitatii, puteti participa in acest studiu care implica o faza de interventie chirurgicala si o faza de urmarire a evolutiei dvs timp de 1 an, ambele gratuite Toti participantii din studiu vor fi evaluati inaintea interventiei medicale, iar apoi la 14 zile, 1 luna, 3 luni, 6 luni si 1 an Participantii eligibili pentru studiu vor fi distribuiti in grupul de interventie chirurgicala parodontala interventia chirurgicala parodontala consta in acoperirea zonelor de retractie izolata prin procedeul cel mai indicat cazului sau printr-o terapie chirurgicala de reducere a pungilor, cu sau fara aditie de os Ulterior acestei interventii este urmarita evolutia dvs prin intalniri stabilite la interval de 14 zile, 1 luna, 3 luni, 6 luni si 1 an interventia mentionata anterior poate fi primita contra cost in majoritatea serviciilor medicale, atat publice, cat si private Participantii la studiu sunt rugati sa completeze la inrolare si pe parcursul derularii studiului diverse scale psihologice C RiSCURi Efectele secundare ale interventiei chirurgicale parodontale se refera la efecte inerente asociate interventiei (dureri la locul interventiei, tumefieri) si pana la situatii extreme, rar mentionate de literatura de specialitate (necroza grefei, hemoragii, expunerea si infectia membranei, atunci cand este folosita) Tratamentul va fi oprit daca apar unele dintre efectele mai sus mentionate D BENEFiCii Beneficiul potential al implicarii in acest studiu se refera in principal la o reducere a simptomelor asociate bolii de baza pentru care v-ati adresat medicului, a simptomelor asociate interventiei Desi nu se poate spune ca veti beneficia in procent de 100% in urma acestor tratamente, studiile anterioare arata ca un procent foarte mare de pacienti isi rezolva sau isi amelioreaza semnificativ simptomele si problemele asociate E CONFiDENtiALiTATE Acordul dvs cu acest formular va autoriza echipa de cercetare sa colecteze si sa foloseasca informatii din studiu tinand cont ca informatia colectata va fi utilizata numai pentru scopuri de cercetare, toate eforturile vor fi mobilizate pentru a nu va dezvalui identitatea in orice document sau publicatie rezultate in urma acestui studiu Confidentialitatea informatiilor referitoare la dvs va fi in acord cu legile aplicabile F RETRAGEREA Participarea este complet voluntara Manifestarea interesului pentru studiu nu va obliga sa participati Chiar daca la inceput decideti sa participati si apoi va razganditi, va puteti retrage in orice moment fara penalizari Daca veti lua aceasta decizie va recomandam: (1) sa anuntati decizia dvs (celui care v-a oferit tratamentul) pentru buna derulare a studiului; (2) sa consultati obligatoriu un alt medic stomatolog pentru a stabili un alt tratament si a preveni complicatiile care ar putea sa apara tinand cont de conditia dvs De asemenea, pe parcursul cercetarii cel care face tratamentul poate sa va recomande consultarea medicului de familie sau a unui alt medic stomatolog pentru a preveni anumite complicatii; pentru reducerea riscurilor va rugam sa luati in considerare aceste recomandari Echipa de cercetare are de asemenea dreptul de a opri participarea dvs in studiu Aceasta decizie poate fi luata din cauza unor reactii neasteptate, a unor esecuri repetate de a urma instructiunile sau din cauza ca intreg studiul este oprit G RESPONSABiLiTATE Acest studiu a fost initiat de catre Universitatea "Babes-Bolyai" (Catedra de Psihologie Clinica si Psihoterapie), Universitatea de Medicina si Farmacie "iuliu Hatieganu" (Catedra de Parodontologie), Universitatea de Medicina si Farmacie "Victor Babes" din Timisoara si institutul de Cercetari pentru instrumentatie Analitica Cluj Calitatea si responsabilitatea tratamentului revine medicului stomatolog care ofera direct tratamentul Tratamentul va fi oferit in cadrul unui orar stabilit de comun acord cu dvs Am citit explicatiile privind acest studiu si am avut oportunitatea de a adresa intrebari de clarificare aditionale imi dau acordul pentru participarea la studiu Nume: Semnatura: Data: Semnarea formularului de consimtire informata reprezinta ultima secventa a primei etape, de recrutare si selectie, specifica unui studiu randomizat controlat Desigur, etapa de recrutare si selectie a participantilor poate fi considerata drept etapa initiala, avand in vedere implementarea efectiva a studiului implementarea este precedata, de etapa de planificare a studiului, de etapa de obtinere a acordului pentru derularea studiului din partea unei comisii de etica cercetarii si, desigur, de etapa obtinerii fondurilor necesare pentru acoperirea cheltuielilor cu derularea studiului, considerate a fi etape premergatoare implementarii 4 2 1 2 Etapa de derulare a studiului in cadrul acestei etape are loc alocarea randomizata a participantilor in grupele din cadrul experimentului, se aplica interventiile convenite si au loc masuratori intermediare (aspect optional), respectiv cele realizate la finalul derularii interventiei (evaluare postinterventie) 4 2 1 2 1 Alocarea randomizata in grupele experimentale Secventa de alocare randomizata a participantilor a fost descrisa in sectiunea 4 1 3 De aceea, ne vom rezuma la a prezenta cele trei caracteristici ale unei alocari randomizate in grupele experimentale considerate a fi necesare pentru o randomizare de o calitate superioara Primul aspect vizeaza algoritmul de randomizare ales Acesta ar trebui sa fie unul adaptat numarului de participanti de inclus in fiecare grupa, tipului de recrutare (recrutati simultan sau secvential - vezi figura 4 3) si sa nu permita anticiparea grupei din care face parte un individ (de exemplu, nu este recomandabila randomizarea sistematica, cu pas, deoarece ordinea de introducere a participantilor in studiu ar putea fi manipulata de catre cercetator, fapt care ar conduce la o distorsiune in selectie) Cel de-al doilea aspect dezirabil vizeaza separarea activitatii de stabilire a gradului de eligibilitate a unei persoane pentru a fi inclusa in studiu, de cea care presupune randomizarea participantilor in grupele experimentale Acest lucru se obtine prin alocarea acestor activitati unor persoane diferite pentru a reduce riscul unei distorsiuni in selectie (de exemplu, pentru a evita practica de a-i include pe cei eligibili, dar cu un profil care indica o complianta scazuta la tratament, sa fie inclusi in grupul de control pentru a maximiza sansele obtinerii unor diferente semnificative statistic, in directia dorita, aceea a superioritatii lotului experimental) Cea de-a treia caracteristica dezirabila vizeaza transparenta interventiilor (conditia de orbire) Pentru a reduce riscurile aparitiei unor distorsiuni (efect Hawthorne, demoralizare, expectante diferite privind evolutia participantilor, comportament diferentiat fata de participanti in functie de interventia primita, distorsiuni in evaluare) ar fi ideal daca studiul ar fi derulat in conditii de tip triplu-orb Deoarece este putin probabil ca acest lucru sa fie facut in cercetari din domeniul psihologiei, mult mai usoara ar fi implementarea unei conditii de tip simplu-orb, avand drept protagonisti asistentii de cercetare responsabili pentru evaluarile realizate preinterventie, in timpul interventiei, postinterventie sau in follow-up Acest lucru ar fi necesar mai ales in contextul in care variabilele dependente principale sunt evaluate intr-o maniera subiectiva, prin aprecieri ale progreselor facute 4 2 1 2 2 implementarea interventiei Aceasta secventa trebuie sa respecte aspectele planificate si prezentate in formularul de consimtire informata (de exemplu, durata perioadei de interventie, gradientul interventiei - numarul de sedinte) in plus, in aceasta secventa exista diferente importante intre studiile cauzale (efficacy studies) si cele pragmatice (effectiveness studies) in cazul primelor este foarte important sa existe o respectare a protocolului initial atat din partea celor desemnati sa implementeze interventia, in baza celor cuprinse intr-un manual al interventiei, cat si din partea celor care au consimtit sa primeasca interventia alocata De asemenea, continutul fiecarei intalniri (sedinte de implementare) trebuie respectat Din perspectiva implementarii unei interventii, ar fi necesar sa se observe masura in care livrarea interventiei a avut loc conform planului , respectiv masura in care participantii la studiu au aderat (au manifestat complianta) la interventia primita Aceste aspecte sunt necesare pentru a aprecia daca sunt afectate validitatea de construct (livrarea interventiei), respectiv validitatea interna a studiului (aderenta la interventie) in cazurile in care se constata abateri substantiale in implementarea interventiei de la cele prevazute initial, se poate ajunge la propuneri de excludere a acestor cazuri din analiza, deoarece devierea semnificativa de la planul initial constituie un factor de risc pentru validitatea interna si validitatea de construct a concluziilor studiului De aceea, acest control strict prezent in studiile cauzele este necesar pentru a reduce erorile sistematice, in ideea de a ne asigura ca interventia (asa cum a fost ea planificata) este cea care a condus la efectele obtinute si nu alte aspecte colaterale, introduse pe parcurs in schimb, studiile pragmatice pornesc de la premisa ca este mai importanta reproducerea conditiilor din realitate (in care trainerii, psihoterapeutii, desi au un plan initial, pot devia de la acesta in functie de nevoile fiecarui participant), decat sa se respecte aspectele planificate, desi acest lucru creste riscul de a oferi interventii ce variaza, intre anumite limite, de la un participant la altul, cu consecinte negative asupra validitatii interne si de construct a concluziilor studiului in schimb, prin aceasta strategie adoptata, studiile pragmatice castiga in ceea ce priveste validitatea externa a studiului, indeosebi cu privire la validitatea ecologica De altfel, pe langa diferentele ce tin de conditiile de eligibilitate pentru includerea in studiu (mai relaxate in cazul studiilor pragmatice), principala diferenta dintre studiile cauzale si cele pragmatice are in vedere modul de implementare a interventiilor Cerinta ca implementarea interventiei sa se realizeze conform celor explicitate in manualul interventiei este mult mai stricta in cazul studiilor cauzale decat in a celor pragmatice Pentru a creste fidelitatea fata de propunerea initiala, cu ocazia implementarii unei interventii se pot utiliza o serie de strategii menite sa sprijine validitatea de construct (Shadish et al , 2002): (a) in directia livrarii corecte a interventiei, prin existenta unui manual de implementare a interventiei, sustinut de mijloace instructive (casete video demonstrative, discutii si feedback corectiv din partea unor supervizori, in baza unor cazuri inregistrate; training in implementare); (b) in directia cresterii aderentei (compliantei) participantului la interventie tratament, prin comunicarea explicita a temelor pentru acasa insotita de hand-out-uri, quizz-uri periodice de cunostinte, discutii discursuri motivationale, discutii cu membrii familiei in ideea incurajarii implicarii in interventie, stimularea aderentei la interventie prin oferirea de mici premii (tombola) etc Un aspect extrem de important, dar deseori neglijat in partea de implementare, se refera la identificarea influentei unor factori externi deoarece validitatea concluziilor unui studiu controlat nu tine doar de implementarea corecta a interventiei, ci si de absenta unor factori straini perturbatori Astfel, este posibil ca participantii sa fie inclusi concomitent in mai multe studii si sa existe, astfel, o interferenta sau un transfer intre interventiile primite De asemenea, trebuie verificata situatia celor inclusi in grupul de control pasiv (fara interventie), pentru a observa masura in care acestia isi mentin acest statut pe parcursul interventiei sau daca actioneaza individual in vederea ameliorarii problemei lor Pe langa importanta livrarii acurate a interventiei un alt factor important, trebuie luat in calcul in legatura cu cei care implementeaza interventia, vizeaza competenta acestora de a oferi o interventie de calitate in acest sens, se obisnuieste sa se apeleze la persoane care: (a) detin certificare recunoscuta in domeniul interventiei (de exemplu, certificat de formator in trainingul sau coaching-ul respectiv, atestat de psihoterapeut in tehnica psihoterapeutica implementata); (b) poseda o experienta relativ bogata, preferabil atat in aplicarea interventiei respective, cat si in abordarea problemelor supuse spre rezolvare (de exemplu, experienta in cazuistica depresiva) Desigur, acest aspect nu are un caracter obligatoriu atat timp cat este monitorizata atent partea de livrare a interventiei, mai ales daca se au in vedere aspecte economice (raportul cost-eficienta) Se cunoaste faptul ca nivelul costurilor unei interventii creste daca pentru implementarea acesteia se apeleaza la specialisti decat daca ea se bazeaza pe novici in sfarsit, pe parcursul derularii interventiei ar fi indicat sa se ia masuri care sa conduca la un procent cat mai redus de renuntare la cercetare (dropout sau attritiori) De exemplu, ar fi dezirabil, in cazul in care exista mai multi asistenti de cercetare, sa fie alocata aceeasi persoana pentru a colecta datele cu ocazia evaluarilor diverse (pentru a ajuta la consolidarea relatiei interpersonale dintre participanti si asistenti, desigur, daca nu au existat conflicte intre cele doua parti) De asemenea, i se poate aduce aminte periodic participantului despre importanta studiului pentru cunoastere sau i se pot oferi stimulente pentru participare (inclusiv mici cheltuieli de protocol - apa, fursecuri) in plus, pentru a preveni absenteismul de la sedintele de interventie, se poate trimite un SMS sau   de reamintire cu privire la data, ora si locatia urmatoarei sedinte O alta masura deosebit de utila este aceea de a reduce perioada de timp existenta intre semnarea formularului de consimtire informata si implementarea efectiva a interventiei 4 2 1 2 3 Evaluari colectate cu ocazia derularii interventiei Orice studiu randomizat controlat cuprinde obligatoriu o secventa de evaluare realizata postinterventie, pentru a urmari diferentele observate intre grupele incluse in studiu Aceasta evaluare este necesara pentru a demonstra existenta unei relatii cauzale in functie de natura grupului de control, rezultatul obtinut la nivel de postinterventie poate fi utilizat pentru a arata ca: (a) interventia este una eficienta (control exercitat prin liste de asteptare absenta interventiei); (b) efectul se datoreaza caracteristicilor specifice ale interventiei (control exercitat prin placebo interventii nespecifice); (c) interventia este mai buna, cel putin la fel de buna sau nu este inferioara alteia (control exercitat prin interventii uzuale, interventii recomandate, interventii standard) etc Desigur, pentru a potenta comparatiile facute si efectele obtinute, modelul standard de studiu randomizat controlat presupune evaluari ale variabilei dependente primare, atat la nivel de preinterventie, cat si la finalul perioadei de urmarire, adica la un anumit interval de timp dupa incheierea aplicarii interventiei in schimb, daca obiectivul urmarit prin studiu nu este doar acela de a demonstra existenta unei relatii de tip cauza-efect, ci vizeaza identificarea unor mecanisme psihologice responsabile pentru schimbarea obtinuta, atunci etapa de derulare a interventiei va cuprinde suplimentar, pe langa evaluarea VD, masuratori si ale potentialelor variabile mediatoare (cu rol explicativ pentru schimbarile observate) in plus, pe langa momentele standard (preinterventie, postinterventie si finalul perioadei de urmarire), se apeleaza la una sau mai multe evaluari intermediare (pe parcursul interventiei), atat privind nivelul variabilelor dependente, cat si cel al potentialelor variabile mediatoare (mecanisme ale schimbarii) Tabelul 4 5 Momente ale evaluarii in functie de obiectivul studiului Mecanismele schimbarii Evaluarea relatiei cauza-efect Evaluarea mediatorilor Evaluarea VD Tip de design Pre interim Post Urm Pre interim Post Urm Standard (demonstrarea unei relatii cauzale) O O O O X O X X identificarea mecanismelor schimbarii X X X X X X X X Legenda: X - evaluare; O - absenta evaluarii Aceste evaluari intermediare reprezinta una dintre conditiile necesare pentru a identifica un anumit mecanism al schimbarii ("cum se produce schimbarea, efectul?"), deoarece premisa acceptata este ca modificarile la nivelul variabilei mediatoare preceda temporal modificarile de la nivelul variabilei dependente primare De pilda, intr-un studiu ce urmareste eficienta terapiei rational-emotive in combaterea depresiei, in care se teoretizeaza ca principalul mecanism al schimbarii pentru reducerea simptomatologiei depresive vizeaza diminuarea cognitiilor irationale autodepreciative, ar trebui introdusa cel putin o evaluare intermediara, insa dezirabil ar fi sa existe mai multe asemenea evaluari intermediare Aceasta ne-ar permite sa observam ca, pe masura implementarii terapiei, apare mai intai o diminuare a nivelului cognitiilor irationale autodepreciative urmata de o reducere a simptomatologiei depresive si ca intre cele doua aspecte exista o asociere semnificativa Astfel, in studiile focalizate pe mecanismele schimbarii se apeleaza la evaluari intermediare (pe parcursul derularii interventiei), nu numai ale variabilelor dependente de interes, ci si ale aspectelor psihologice care ar putea fi identificate drept mecanisme ale schimbarii (care explica de ce este eficienta interventia si cum poate fi optimizata aceasta) Alte detalii despre conditiile necesare pentru a identifica mecanismele schimbarii (variabilele mediatoare) responsabile pentru producerea efectului sunt prezentate in sectiunea 4 2 3 Un alt aspect legat de evaluarea VD se refera la cutuma de a diferentia, in cadrul studiilor randomizate controlate, intre variabilele dependente principale (primary outcomes) si variabilele dependente secundare De exemplu, intr-un studiu care are drept scop implementarea unei interventii care sa reduca nivelul de epuizare emotionala (burnout) printre angajati, nivelul de burnout reprezinta variabila dependenta primara Desigur, cu ocazia acestui studiu pot fi colectate si alte date, cum ar fi nivelul productivitatii in munca, satisfactia legata de locul de munca, implicarea in munca etc ), insa acestea reprezinta aspecte colaterale care pot fi afectate de interventia implementata Variabila dependenta primara are rolul de a oferi raspunsul principal cu privire la testarea ipotezei ("este interventia una eficienta pentru problema pentru care a fost dezvoltata?"), precum si in luarea unor decizii cu impact metodologic cum ar fi stabilirea numarului de participanti in studiu, in baza efectului estimat al interventiei asupra variabilei dependente principale in sfarsit, un ultim aspect de discutat, cu relevanta pentru evaluarea impactului interventiei, are in vedere diferentele existente intre studiile cauzale si cele pragmatice cu privire la alegerea variabilelor dependente masurate Pentru a prezenta aceste diferente, vom distinge mai intai intre variabile dependente reale (true outcomes) si variabile dependente surogat (surrogate outcomes) (Torgerson si Torgerson, 2008) De pilda, in cazul unui program menit sa reduca delincventa la adolescenti, variabile dependente reale ar putea fi prezenta sau absenta unui comportament delincvent inregistrat la politie, prezenta sau absenta unei recidive, in timp ce variabile dependente surogat ar putea fi nivelul de agresivitate sau nivelul comportamentului antisocial masurat prin scale de specialitate VD reale sunt cele vizate direct sau indirect de orice interventie, prin impactul lor la nivel social in schimb, VD surogat, desi se afla in stransa legatura cu aspectele reale vizate si deseori conduc la aparitia VD reale, nu ofera certitudinea aparitiei acestor efecte Spre exemplu, nu intotdeauna o satisfactie maritala scazuta se soldeaza cu divort, nu intotdeauna esecul de a reduce cognitiile irationale asociate violentei domestice se manifesta prin acte manifeste de violenta domestica, nu intotdeauna reducerea densitatii oaselor se manifesta prin fracturi etc Tabelul 4 6 Exemple de variabile dependente reale, respectiv surogat in domenii diverse Scopul interventiei VD surogat VD reala Probleme in relatia de cuplu satisfactie maritala divort Violenta domestica reducere cognitii irationale reducerea agresivitatilor raportate Osteoporoza reducerea densitatii din oase fractura Domeniul educational atitudinea fata de scoala abandon scolar Domeniul organizational epuizare emotionala procent fluctuatie de personal infractio nalitate a nivelul de ostilitate agresivitate comitere infractiuni Studiile pragmatice, prin caracteristica lor de a avea o validitate externa (ecologica) ridicata, prezinta un interes crescut pentru publicul larg si pentru formatorii de politici De aceea, in cazul lor se recomanda sa se utilizeze variabile dependente reale Acest lucru este posibil si pentru ca, in cazul acestui gen de studii (conditii relaxate de eligibilitate absenta monitorizarii integritatii interventiei), pot fi colectate mai multe date (mai multi participanti), care sa asigure o putere statistica suficienta pentru a detecta marimi ale efectelor mai scazute, mai specifice cazului masurarii VD reale decat masurarii variabilelor-surogat in schimb, in studiile cauzale, desi ar fi dezirabil sa fie utilizate tot VD reale in calitate de VD principale, acest lucru deseori nu este posibil din ratiuni metodologice Prin conditiile stricte impuse cu privire la selectarea participantilor si implementarea studiului este dificil sa fie strans un volum foarte mare de participanti la studiu in plus, efectele oricarei interventii tind sa fie mai ridicate ca marime in cazul variabilelor-surogat decat a celor reale in consecinta, pentru a evita probleme cauzate de o putere statistica mai scazuta (de genul erorii de tip ii in testarea ipotezelor), se obisnuieste ca VD principale intr-un studiu cauzal sa fie din categoria VD surogat, chiar daca sunt colectate secundar si masuri ale VD reale 4 2 1 З Etapa de urmarire Scopul implicit al oricarei interventii este acela de a produce modificari in directia dorita care sa reziste in timp, astfel incat efectele produse sa nu fie doar unele tranzitorii De aceea, in sprijinul acestui scop nu este suficient doar sa ne focalizam asupra comparatiei dintre grupe, efectuata cu ocazia evaluarii postinterventie (de la finalul etapei de derulare a interventiei), ci este nevoie sa urmarim (follow-up) daca diferentele observate se mentin in timp, se accentueaza sau se reduc sau chiar dispar, odata cu trecerea timpului Durata etapei de urmarire nu este una standard, insa majoritatea studiilor randomizate controlate apeleaza la o perioada cuprinsa intre sase luni si doi ani Rolul cercetatorului in aceasta secventa este in principal acela de a apela la masuri care sa asigure un nivel cat mai scazut de pierdere a participantilor, indeosebi prin: (a) asigurarea accesului disponibilitatii participantilor pentru evaluari in perioada de urmarire; (b) verificarea masurii in care in istoricul participantului nu au fost inregistrate evenimente care sa afecteze validitatea concluziilor obtinute (de exemplu, verificarea faptului ca participantul nu a apelat in perioada de urmarire la interventii tratamente alternative pentru problematica vizata, nu a apelat la alti specialisti pentru a continua sa primeasca interventia alocata etc ) Pentru primul aspect, acela de a facilita accesul la participanti in perioada de follow-up, cateva indicatii utile (Shadish et al , 2002) ar fi: (a) colectarea datelor de contact nu numai de la participant, ci si de la una sau doua persoane apropiate acestuia, pentru a creste sansa de a-l contacta ulterior, in cazul in care datele sale de contact nu mai sunt valabile; (b) mentinerea contactului cu participantii prin scurte informari telefonice (scrise), pentru a obtine reconfirmarea de la participant cu privire la disponibilitatea sa de a fi evaluat ulterior, indeosebi in perioada premergatoare evaluarii (de exemplu, cu o saptamana inainte); in plus, preferabil ar fi daca comunicarea ar fi facuta de catre acelasi asistent de cercetare cu care participantul a interactionat pe parcursul evaluarilor anterioare; (c) flexibilitate cu privire la locatia in care are loc evaluarea (deplasare la sediul participantului) si sau oferirea de stimulente (plata transportului, recompensare financiara pentru sedinta de evaluare); (d) mici gesturi de atentie (de exemplu, trimiterea unei felicitari cu ocazia zilei de nastere a participantului); (e) oferirea unei brosuri cu informatii utile (calendarul evaluarilor in perioada de follow-up; mentionarea stimulentelor financiare oferite, daca este cazul, pentru evaluarile din perioada de urmarire; precizarea datelor de contact unde participantul ar trebui sa anunte daca apar modificari in datele sale de contact etc ) in ceea ce priveste cel de-al doilea aspect care conduce la pierderea participantilor, acela de contaminare a interventiei alocate (de exemplu, persoane care au urmat interventia X in etapa de derulare a acesteia, dar care apeleaza la interventia alternativa Y in perioada de urmarire), se pot activa cateva strategii de reducere a acestui risc Una dintre acestea consta in oferirea posibilitatii participantului de a apela la cateva (doua sau trei) sedinte suplimentare din interventia alocata (boosting sessions) De exemplu, in cazul interventiilor din zona psihoterapiei este acceptabil sa li se ofere doua-trei sedinte suplimentare intr-un interval de sase luni, pe care participantii sa le planifice in perioada de urmarire, doar daca au neaparat nevoie de ele O alta posibilitate existenta, fezabila in anumite cazuri (in functie de problema si aspectele etice implicate), este aceea de a include participantul pe o lista de asteptare si de a-i oferi ulterior interventia promisa, dupa finalizarea perioadei de urmarire Desigur, o masura obligatorie in legatura cu problema contaminarii interventiei, este aceea de a intervieva participantii (de exemplu, telefonic, cu ocazia pregatirii sedintelor de evaluare derulate in perioada de urmarire) pentru a vedea in ce masura ei au apelat pe cont propriu la continuarea interventiei respective sau la alte metode de interventie concurente (alternative) Asemenea situatii il scot pe participant din faza de urmarire deoarece primeste in continuare un tratament activ Tot cu ocazia acestui interviu pot fi evidentiate evenimente importante aparute in istoricul individului, care ar putea afecta evolutia sa (prin diminuarea sau accentuarea problemei avute) 4 2 1 4 Etapa de analiza Din punct de vedere logistic, aceasta reprezinta cea mai usoara si scurta etapa din cadrul unui studiu randomizat controlat Din ratiuni pedagogice, vom diviza aceasta etapa in trei elemente distincte: (a) analiza standard; (b) analiza la nivelului intentiei de a interveni (intent to treat); (c) alte analize relevante 4 2 1 4 1 Analiza standard in cadrul acestei analize se testeaza ipotezele cercetarii, un rol principal revenindu-i ipotezei care vizeaza efectul interventiei asupra VD primare Din acest punct de vedere, cele mai importante analize sunt comparatiile dintre grupe realizate la momentul postinterventiei, precum si in perioada de follow-up Comparatia de la nivelul postinterventiei ne arata daca interventia propusa a avut un efect (este mai eficienta decat o interventie alternativa etc ), in timp ce comparatiile la nivel de follow-up ne indica daca efectul este unul durabil in cazul analizei standard sunt relevante (vezi nota 1, p 174) si analizele intragrupale (de exemplu, pentru a analiza daca exista modificari semnificative ale VD intre pretest si posttest in cadrul grupului experimental) Tot in cadrul analizei standard are loc si analiza de verificare a echivalentei grupelor incluse in studiu la nivel de pretest (preinterventie) Daca echivalenta asumata in baza alocarii randomizate este sustinuta (dublata) empiric prin compararea evaluarilor efectuate la momentul preinterventiei, datele de la nivel de postinterventie si follow-up pot fi analizate simplu, prin apelul la testul t student sau tehnicile ANOVA, in functie de caz Daca echivalenta la nivel de preinterventie nu este sprijinita empiric (exista diferente intre grupele comparate, in ciuda alocarii randomizate), aceste diferente pot fi tratate drept covariabile sau pot fi incluse in analizele statistice standard ale diferentelor observate intre pretest si posttest (gain scores) Desigur aceste aspecte sunt valabile atat pentru studiile cauzale, cat si pentru cele pragmatice, in contextul in care obiectivul studiului se rezuma la identificarea unei relatii de tip cauza-efect Daca obiectivele studiului vizeaza identificarea mecanismelor schimbarii, designul si analiza standard se complica (vezi detalii in sectiunea 4 2 3) 4 2 1 4 2 Analiza la nivelul intentiei de a interveni Spre deosebire de cazul ideal, in realitate intre numarul participantilor imediat dupa momentul alocarii lor randomizate in grupele experimentale si numarul participantilor la finalul perioadei de urmarire pot exista diferente mari Acest lucru se intampla pentru ca unii participanti refuza sa urmeze interventia alocata, desi initial si-au dat acordul pentru aceasta, altii renunta pe parcursul derularii interventiei (nu finalizeaza programul convenit), iar altii sunt pierduti pe parcursul duratei de follow-up fie din cauza aparitiei contaminarii interventiei, fie din cauza absentei masuratorilor din perioada de urmarire (participanti care refuza sa fie evaluati repetat sau participanti ale caror date de contact nu mai sunt valabile si care nu mai pot fi reperati prin mijloace alternative de cautare) in urma acestei situatii este posibil ca uneori doar 5060% dintre participantii alocati initial intr-un anumit grup experimental sa poata fi evaluati pana la final pentru a surprinde efectele interventiei Din acest punct de vedere, este important sa se identifice motivul pentru care participantul a fost pierdut pentru analiza: (a) din cauza interventiei in sine (treatment attrition) (participantul renunta pentru ca ar fi preferat o alta interventie, nu o gaseste suficient de interesanta pentru a continua pe cea alocata, resimte efecte secundare negative etc ); (b) din motive obiective ale participantului (se muta intr-o alta localitate, aparitia unor evenimente cu impact in viata sa); (c) din motive obiective tehnice (diminuarea finantarii, insotita de o reducere a numarului de participanti; defectiuni in salvarea unor date pe calculator etc ) Daca persoanele incluse in punctele b si c pot fi excluse din analiza pe anumite secvente (acolo unde lipsesc datele) fara a afecta validitatea concluziilor, excluderea participantilor care au renuntat la studiu din motivele invocate la punctul a poate conduce la rezultate distorsionate Sa ne imaginam ca am fi dorit sa evaluam in ce masura studentilor le-ar placea sa studieze metodologia cercetarii printr-o strategie didactica alternativa Sa presupunem ca am fi inclus initial 100 de persoane, dar ca pe parcurs 25 dintre ele au renuntat pentru ca se plictiseau sau nu intelegeau prelegerile, iar alte 25 au renuntat in favoarea unei alte metode de predare pe care o gaseau mai atractiva Daca noi am analiza, in acest caz, datele colectate doar de la cei 50 de participanti ramasi in sala pana la final cu siguranta am obtine scoruri distorsionate, mult mai favorabile interventiei propuse decat daca am fi colectat datele de la toti cei 100 de participanti initiali Pentru a preintampina asemenea distorsiuni, in cazurile in care se inregistreaza un procent mai mare de 10-15% de renuntare din cauza incompatibilitatii cu interventia sau in care se constata diferente in rata de renuntare intre grupul experimental (de exemplu, 15%) si cel de control (de exemplu, 5%), se apeleaza complementar la analiza statistica la nivelul intentiei de a interveni in defavoarea analizei standard, in plus fata de analiza standard Astfel, vom putea compara impactul pe care il are fenomenul de pierdere a participantilor cauzat din alte motive decat cele obiective si in ce masura afecteaza el concluziile studiului Solutia uzuala in analiza de acest tip presupune luarea in considerare a ultimelor scoruri disponibile, inclusiv de la participantii care au renuntat sa primeasca interventia din dorinta lor De exemplu, daca exista date inregistrate doar la nivel de preinterventie, se va asuma ca aceste valori vor fi obtinute si in testarile ulterioare Daca participantul a fost evaluat initial (pretest), dar a participat la o parte dintre sedinte, fiind evaluat intermediar in doua momente (de exemplu, dupa sedinta 4 si dupa sedinta 8), insa nu exista rezultate cu privire la performanta lui masurata la momentul postinterventiei, se va trece in locul datelor lipsa scorul inregistrat la ultima evaluare intermediara pentru care exista date (sedinta 8) etc O strategie alternativa mai buna, insa cu sorti mai mici de izbanda, ar fi aceea de a solicita, inclusiv celor care au renuntat la interventia alocata din motive de incompatibilitate cu aceasta, sa participe la evaluarile periodice (fie ele intermediare, postinterventie sau din perioada de urmarire) Aceste rezultate ar reprezenta mai bine situatia reala decat asumarea pastrarii constante a rezultatelor obtinute cu ocazia ultimei evaluari disponibile Desigur, cel mai probabil, ar fi nevoie de oferirea de stimulente pentru a-i determina pe cei care au renuntat la studiu din motive de incompatibilitate cu interventia alocata, sa ramana participanti activi in studiu, pentru aceasta secventa de evaluare in sfarsit, un alt aspect important de urmarit, indiferent de procentul participantilor care s-au retras din studiu, este analiza caracteristicilor participantilor care s-au retras din studiu De interes sunt atat caracteristicile lor demografice, cat mai ales unele variabile de interes (factori de risc, nivelul VD principale la pretest etc ), pentru a vedea care segment de participanti este mai vulnerabil de a renunta la tipul de interventie alocata 4 2 1 4 З Alte analize relevante Cel putin in domeniul psihologiei clinice, unde nivelul de rigurozitate asociat studiilor randomizate controlate este unul extrem de ridicat ca urmare a modelului preluat din stiintele medicale, se recomanda analize suplimentare celor care vizeaza direct evaluarea variabilelor dependente, a celor mediatoare sau moderatoare in aceasta directie se recomanda a se diferentia intre efectul impactul factorilor comuni, nespecifici formei de interventie analizata (cum ar fi alianta terapeutica, gradul de aderenta la protocolul interventiei, complianta clientilor), de impactul factorilor specifici interventiei respective De exemplu, in cazul aderarii la protocolul interventiei, se observa masura in care activitatile sunt conforme cu cele precizate in protocolul interventiei in cadrul unui esantion de sedinte din cele efectuate, pentru a oferi siguranta suplimentara pentru validitatea de construct a rezultatelor De asemenea, se poate diferentia efectul specific al interventiei dupa controlarea variatiilor in nivelul VD determinate de factorii psihoterapeutici nespecifici (relationarea si increderea in psihoterapeut, implementarea interventiei in acord cu recomandarile pentru aceasta, complianta clientilor la tratament etc ) in aceasta directie au fost dezvoltate o serie de scale care sa masoare aceste aspecte nespecifice, ce pot fi evaluate si supuse analizei statistice in mod suplimentar fata de aspectele directe urmarite Un alt aspect relevant este conceptul de semnificatie clinica (care ar putea fi extins catre alte domenii de interes sub numele de semnificatie sau relevanta practica) La ce se refera acest lucru? Obtinerea unei diferente semnificative statistic intre doua grupe comparate (de exemplu, intre un grup care a primit o interventie menita sa reduca nivelul agresivitatii si un grup de control de tipul listei de asteptare) nu inseamna automat ca interventia este deosebit de benefica din punct de vedere practic E posibil, de exemplu, ca nivelul de agresivitate in grupul experimental sa fi scazut ca frecventa de aparitie, dar din punct de vedere practic nu prea are relevanta daca cineva apeleaza la un limbaj agresiv cu o frecventa de 7 ori pe ora sau cu o frecventa de 5 ori pe ora in mod similar, daca nivelul de depresie in urma unei interventii se modifica de la 17 la 15 puncte (masurate cu ajutorul scalei Beck), individul sufera in continuare de un nivel moderat de depresie, chiar daca diferenta de doua puncte replicata la nivelul celor doua grupe ar insemna o diferenta semnificativa statistic De aceea, pe langa observarea unei diferente intre grupele comparate reflectate printr-un rezultat semnificativ statistic (p X O2 O C 7 corect Test screening (c) (d) Total screening negativ (c + d) negativ 10 cazuri de fals negativ 440 de cazuri identificate = 450 SDQ 5; de 0,59 si 0,96 pentru un scor-limita pentru un test pozitiv > 7; si de 0,33, respectiv 0,99 pentru un scor-limita al unui test pozitiv > 9 Capitolul 6 Studiile de evaluare economica a serviciilor psihologice La o prima vedere, cititorii pot fi surprinsi de decizia de a rezerva un capitol intreg discutarii fundamentelor evaluarii economice intr-o lucrare de psihologie, chiar daca discutia are loc in contextul furnizarii de servicii de evaluare si interventie psihologica Pe parcursul capitolelor anterioare s-a accentuat ideea unei practici psihologice validate stiintific prin cercetare insa orice serviciu de natura psihologica implica un consum de resurse, implicit costuri Prin urmare, serviciul trebuie nu doar sa fie unul validat stiintific, ci si unul eficient din perspectiva financiara Piata serviciilor psihologice creeaza un mediu concurential Prin urmare, de cele mai multe ori se pune problema nu numai in a stabili care serviciu este eficient, ci si in a determina care dintre serviciile functionale are cel mai bun raport cost-eficienta Asadar, miza unei asemenea evaluari economice are loc in contextul in care exista cel putin doua interventii eficiente pentru a rezolva aceeasi problema, urmand a se stabili care dintre acestea este mai eficienta sub raport economic Figura 6 1 Schema logica de baza a unei evaluari economice Acest tip de gandire domina atat mentalul beneficiarilor serviciilor de psihologie din domeniul organizational (decidentii din companii fiind primii interesati sa afle "cat costa serviciul propus?" sau "care este castigul adus?"), cat si starea de fapt intalnita in domenii precum cel medical sau cel scolar, confruntate cu bugete limitate Din acest punct de vedere, cel mai avansat sistem decizional in baza evaluarilor economice este intalnit in Marea Britanie (Taylor, 2009) in aceasta tara serviciile de sanatate sunt supuse unei evaluari economice, fiind finantate doar acele interventii care se dovedesc a avea cel mai bun raport cost-eficienta cost-utilitate A ignora aceasta tendinta naturala elementara de a selecta acele servicii psihologice care maximizeaza efectele dorite in conditiile minimizarii costurilor inseamna a ignora regulile simple ale unei piete libere sau ale unei societati ce dispune de resurse (bugete) limitate pentru a acoperi serviciile psihologice necesare populatiei O astfel de neglijare contribuie la marginalizarea serviciilor psihologiei (din sfera serviciilor de sanatate sau educatie publica finantate direct sau indirect de catre stat) si la o reducere a atractivitatii unor asemenea servicii in domeniul organizational (mediul privat) Spre ilustrare, oricate mesaje emotionale ar fi transmise catre autoritati privind necesitatea subventionarii unor servicii de psihoterapie catre populatia generala, ele nu vor avea acelasi impact asupra decidentilor publici precum rezultatul obtinut in urma analizei efectuate de Cummings (1977, apud Yates, 1994) Conform acestei analize, pentru fiecare dolar cheltuit cu subventionarea unor sedinte scurte de psihoterapie statul castiga in medie 2,59 dolari prin eliminarea altor costuri (servicii asistentiale) si prin cresterea productivitatii clientilor care au urmat sedintele de psihoterapie Daca asupra nevoii de realizare a unor asemenea analize exista o unitate de opinii, indeosebi din partea decidentilor interesati sa apeleze la servicii cu costuri cat mai reduse, dar cu eficienta ridicata, exista o diversitate de pareri cu privire la modul de realizare a unei asemenea analize in sectiunea urmatoare vom introduce succint principalele tipuri de analize economice bazate pe raportul dintre resursele consumate si valoarea rezultatelor obtinute in celelalte sectiuni vom prezenta mai multe detalii despre fiecare dintre acestea, insistand asupra analizei cost-eficienta si asupra analizei cost-utilitate datorita amplorii cu care sunt utilizate in evaluarile economice ale serviciilor din sfera psihologiei si a sanatatii mentale 6 1 Tipuri de evaluari economice si criterii de selectare a lor Toate evaluarile economice, cu unele rare exceptii, au drept caracteristica comuna faptul ca masoara atat inputul (intotdeauna sub forma unor costuri necesare implementarii unui serviciu), cat si outputul (beneficiile obtinute in urma implementarii acelui serviciu) Evaluarile difera in functie de tipul de output valorizat, acestea fiind discutate la momentul prezentarii fiecarui tip de analiza si sintetizate in tabelul 6 1, adaptat dupa Haycox (2009) 6 1 1 Analiza minimizarii costurilor Acest tip minimalist de evaluare economica este cunoscut si sub denumirea simpla de analiza de costuri deoarece ia in considerare doar costurile implicate, nu si eficienta unui serviciu psihologic De aceea, decizia luata in acest caz este una simpla, fiind selectat serviciul cel mai ieftin Din nefericire, multi oameni de decizie din sfera publica se rezuma la acest gen de analiza, abordarea fiind incurajata de o serie de reglementari legislative, cum ar fi alegerea ofertantului cel mai ieftin Focalizarea in exclusivitate pe costuri, fara a lua in considerare diferentele dintre servicii la nivel de beneficii, poate fi paguboasa pe termen mediu si lung, ajungandu-se adesea la costuri suplimentare ulterioare Fara a absolutiza, adesea lucrurile care costa mai putin au o durata de garantie mai redusa sau conduc la efecte pozitive de intensitate mai scazuta in comparatie cu alte solutii mai scumpe De aceea, acest tip de analiza este potrivita spre a fi implementata intr-o singura situatie, aceea in care interventiile comparate (supuse evaluarii) au acelasi nivel de eficienta, fiind comparabile din perspectiva consecintelor dezirabile pe termen mediu si lung Aceasta conditie este destul de greu de indeplinit, deoarece ar presupune existenta prealabila a unor studii randomizate controlate care sa indice echivalenta sau macar non-inferioritatea formelor de interventie supuse compararii (vezi criteriul scopului comparatiei din capitolul 4, tabelul 4 4) in absenta unor asemenea dovezi ale echivalentei consecintelor rezultate din serviciile supuse compararii, rezultatele analizei pot conduce la decizii gresite din punct de vedere economic 6 1 2 Analiza cost-eficienta Este cel mai intalnit tip de analiza in domeniul serviciilor psihologice, fiind o analiza care ia in considerare atat costurile (exprimate in termeni financiari), cat si beneficiile obtinute (exprimate in termeni nefinanciari) Acest tip de analiza poate fi efectuat pentru a compara eficienta unor servicii de psihologie care vizeaza aceeasi problema si care folosesc un numitor comun pentru a exprima beneficiile De exemplu, se poate compara eficienta unui program de coaching individual menit sa imbunatateasca nivelul de autoeficacitate al noilor angajati cu eficienta unei interventii colective prin traininguri centrate pe acumularea de cunostinte tehnice, daca ambele programe urmaresc acelasi deziderat final - reducerea timpului de asistenta oferita noilor angajati in vederea integrarii in companie -, operationalizat prin costul per zi fara asistenta oferita noului angajat Un alt exemplu din domeniul clinic vizeaza serviciile menite sa combata depresia Pot fi comparate terapia cognitiv-comportamentala cu terapia familial-sistemica din perspectiva costului serviciului pentru a obtine o zi fara simptomatologie depresiva Utilizand o asemenea analiza intr-un studiu anterior am aratat, de exemplu, ca pentru spatiul economic al Romaniei este mai rentabil sa se apeleze la psihoterapie cognitiv-comportamentala decat la medicatie in combaterea depresiei majore, deoarece aceasta are un raport cost-eficienta mai bun decat medicatia standard utilizata - fluoxetina (cu denumirea comerciala Prozac) (Sava, Yates, Lupu, Szentagotai si David, 2009) Beneficiile avute in considerare vizeaza problema investigata (costul unui an fara burnout angajat; costul unei luni fara simptomatologie depresiva pacient; costul anual al programului pentru reducerea fluctuatiei de personal per angajat pastrat in companie etc ) Analiza cost-eficienta permite compararea adecvata a programelor care urmaresc acelasi obiectiv major, insa ea este nepotrivita pentru a compara servicii care urmaresc obiective multiple (de exemplu, atat cresterea productivitatii angajatilor, cat si reducerea fluctuatiei de personal) De asemenea, acest gen de analiza nu permite compararea eficientei programelor daca outputul urmarit este unul diferit (de exemplu, analiza cost-eficienta nu poate raspunde la intrebarea tipica intalnita intr-un context de constrangeri bugetare - ar fi mai potrivit ca statul sa sprijine un program de reducere a anxietatii sociale sau un program de reducere a dependentei de alcool?) Acest fapt se intampla deoarece nu se poate pune un semn de egalitate intre dependenta de alcool si anxietatea sociala din perspectiva implicatiilor pentru calitatea si durata vietii unui individ 6 1 3 Analiza cost-utilitate Acest tip de analiza se apropie mult de ideea unei analize de tip cost-eficienta, avand, asemeni acesteia, costuri exprimate in termeni financiari si efectele pozitive exprimate in termeni nefinanciari Spre deosebire de analiza de tip cost-eficienta, analiza cost-utilitate permite realizarea de comparatii privind eficienta economica a unor servicii destinate unor obiective diferite (de exemplu, este mai eficient sa fie finantat un serviciu de psihoterapie cognitiv-comportamentala pentru a reduce disfunctiile erectile sau un serviciu de terapie comportamentala de tip ABA in cazul copiilor autisti?) Acest tip de analiza este intalnit doar in domeniul larg al serviciilor de sanatate, fiind posibil prin introducerea la nivel de output a unui numitor comun, de obicei exprimat prin QALY - Quality Adjusted Life Years Acest indicator tine seama de utilitatea perceputa a serviciilor comparate in functie de tulburarea urmarita Analiza cost-utilitate, prin numitorul comun pe care-l ofera, permite compararea eficientei economice a unei interventii focalizate pe renuntarea la fumat cu cea a unei program de consiliere pentru diabet sau cu cea a unei interventii chirurgicale de sudare a unei fracturi de femur etc Logica analizei cost-utilitate poate fi transferata si in domeniul organizational (ar trebui incurajat un program de stimulare a celor cu performanta ridicata sau un program de reducere a ratei fluctuatiei de personal?) Cu toate acestea, metodologia de lucru implica o serie de decizii cu caracter relativ (subiectiv), fiind aduse o serie de critici de natura filosofica si tehnica (de exemplu, cine ar fi cel mai indreptatit sa acorde o valoare subiectiva - cunoscuta tehnic ca utilitate: comunitatea, specialistii in medicina, pacientii cu problemele respective etc ) 6 1 4 Analiza cost-beneficiu Analiza cost-beneficiu reprezinta modelul ideal de analiza economica, in cadrul careia atat costurile serviciului oferit, cat si beneficiile rezultate din aceasta stare de fapt sunt exprimate in termeni financiari Acest lucru este mult mai usor de obtinut in domeniul organizational (de exemplu, pot fi estimate costurile necesare inlocuirii unui om plecat din companie intr-un studiu despre fluctuatia de personal) Este insa mult mai dificil de calculat acest lucru in domeniul sanatatii (care ar fi valoarea exprimata in termeni financiari a unui caz insanatosit de anxietate sociala?) De aceea, acest tip de analiza este aproape absenta din sfera psihologiei clinice si a psihoterapiei, fiind ceva mai prezenta in zona serviciilor organizationale ce permit urmarirea unor obiective financiar tangibile (de exemplu, costul unui serviciu de motivare a angajatilor conduce la o crestere a productivitatii medii in munca cu 15%) Tabelul 6 1 Grila de selectare a celui mai potrivit tip de analiza in functie de pozitionarea fata de beneficiile serviciului psihologic oferit (adaptare dupa Haycox, 2009) Tipul de evaluare economica Operationalizarea avantajelor rezultate din serviciul oferit Analiza Se calculeaza doar costurile implicate, fiind utila costului doar in contexte in care exista dovezi privind minim echivalenta efectelor interventiilor comparate interpretare decizie luata Daca exista date privind echivalenta eficientei interventiilor, se alege solutia cea mai ieftina Analiza Se calculeaza atat costurile financiare, cat si Se calculeaza pentru fiecare program cost- avantajele exprimate intr-o maniera nefinanciara, dar evaluat raportul dintre costurile eficienta care au o semnificatie naturala, cum ar fi schimbarea implicate si beneficiul obtinut, dupa (CEA) Analiza cost-utilitate in bine a starii de sanatate a unui pacient CEA permite doar compararea de programe care vizeaza acelasi obiectiv (de exemplu, cost anual persoana fara depresie) Se calculeaza atat costurile, cat si avantajele rezultate, acestea din urma fiind exprimate tot intr-o maniera nefinanciara Eficienta este transpusa in indicatori standardizati (de exemplu, QALY), ceea ce permite si comparatii intre programe care vizeaza care se pot calcula diferente incrementale, care sa indice superioritatea unui program in dauna altuia din perspectiva raportului cost-eficienta Se bazeaza pe o interpretare similara cu cea prezenta in cazul analizei de tip cost-eficienta, cu precizarea ca este vorba de costul pentru fiecare QALY obiective diferite (de exemplu, reducerea simptomatologiei legate de autism vs reducerea depresiei) Analiza Atat costurile, cat si beneficiile sunt exprimate in cost- termeni financiari Poate fi implementata doar daca beneficiu beneficiile pot fi transformate relativ direct in castiguri financiare Acest aspect este mai usor indeplinit in cazul serviciilor psihologice din domeniul organizational, indeosebi in cele in care performanta este masurata financiar interventia selectata este aceea care asigura cel mai mare profit (venituri estimate - costuri estimate) Pot fi implementate doar interventii cu o valoare pozitiva a acestui raport (veniturile sunt mai mari decat costurile implicate - return of investment ROi) 6 2 Analiza cost-eficienta Pentru a intelege cum se realizeaza o analiza cost-eficienta, vom diviza aceasta sectiune in unitatile componente: (a) estimarea costurilor; (b) estimarea eficientei; (c) raportul cost-eficienta si (d) analiza de sensibilitate a acestui raport Pentru a ilustra mai bine aceste aspecte, vom apela la un exemplu din domeniul clinic, pornind de la studiul efectuat pe un lot de pacienti suferinzi de depresie majora (Sava et al , 2009) De asemenea, pentru a intari cele ilustrate, vom oferi o ilustrare a analizei cost-eficienta in domeniul organizational 6 2 1 Estimarea costurilor in estimarea costurilor se au in vedere doua alternative diferite de estimare: costurile financiare pe care le implica interventia in sine si costurile la nivel societal (economice) De exemplu, in cadrul unui program de consiliere individuala pentru a reduce riscul delincventei, costurile financiare s-ar limita la plata resurselor implicate (costurile orelor de consiliere, ale spatiului utilizat pentru acestea, costurile de transport implicate, alte costuri indirecte necesare) in schimb, o abordare economica (la nivel societal) a costurilor ar adauga la cele mentionate deja si costurile de oportunitate (Haycox, 2009) care ar include costurile pacientului (timpul petrecut de acesta in sedinte de consiliere, care inseamna pierderi de bani cu orele libere luate daca el este angajat); timpul neproductiv petrecut de familie pentru sprijinirea celui consiliat; banii pe care statul ii salveaza (reprezentand costurile de incarcerare, judecata etc ), daca individul consiliat este recuperat si nu mai comite acte infractionale La ora actuala tinde sa predomine o perspectiva favorabila estimarii costurilor societale (Fals-Stewart, Yates si Klostermann, 2005) intr-o versiune relativ moderata, aceea de a cuprinde acele costuri care pot fi estimate relativ usor Cea mai potrivita definitie a costurilor implicate este aceea de valoare financiara a resurselor consumate ca urmare a implementarii serviciului psihologic sau care au fost pierdute temporar ca urmare a tulburarii respective (de exemplu, absenteism de la locul de munca, reducerea programului de lucru etc ) in privinta costurilor legate de implementarea serviciilor de psihologie, acestea ar trebui sa includa: (a) costurile legate de timpul necesar implementarii serviciilor (de exemplu, costul per ora al unei sedinte de psihoterapie; timpul alocat de client participarii la aceste sedinte, incluzand timpul de transport si referirile la timpul persoanelor insotitoare, acolo unde este cazul); (b) costurile legate de transportul spre si de la locatia unde se ofera interventia; (c) costurile legate de resursele materiale si echipamentele necesare (probe de urina pentru programele antidrog, teste psihologice, de spitalizare etc ); (d) costuri de inchiriere (legate de spatiul unde se ofera interventia, daca este cazul); (e) costuri indirecte, de regie La aceste categorii de costuri se pot adauga cele societale, cum ar fi costurile reprezentate de pierderile financiare ca urmare a instalarii handicapului temporar (de exemplu, concedii medicale fara plata etc ) (Fals-Stewart, Yates si Klostermann, 2005; Yates, 1999) Pentru fiecare dintre aceste costuri, se recomanda utilizarea unor tabele matriciale pentru a estima cat mai corect costurile Aceste tabele sunt utile prin: (a) impartirea serviciului in secvente; (b) stabilirea tipului de resurse implicate pentru fiecare secventa; (c) stabilirea numarului de unitati de resurse necesare; (d) estimarea costului per unitate (la nivelul pretului mediu al pietei); (e) obtinerea totalurilor marginale si a sumei totale cu cheltuielile implicate Pentru a simplifica acest aspect, vom prezenta un tabel cu estimarea costurilor per pacient prezentat in Sava si colaboratorii (2009) in cadrul acestuia se observa analiza consumului de resurse pe tipuri majore de activitati implicate, divizat in cheltuieli financiare (pentru oferirea serviciilor respective) si cheltuieli suplimentare ale clientului (pentru a oferi o perspectiva societala estimarii acestor costuri) in studiul respectiv se urmarea realizarea unei analize cost-eficienta in combaterea depresiei majore intre tratamentul medicamentos prin fluoxetina (Prozac) si doua forme de psihoterapie de sorginte cognitiv-comportamentala, terapia cognitiva dezvoltata de Beck (CT), respectiv terapia rational-emotiva dezvoltata de Ellis (REBT) Programul prevedea 20 de sedinte de psihoterapie a cate 50 de minute fiecare, respectiv 20 de intalniri informative de monitorizare a efectului medicatiei cu durata intre 15 si 20 de minute fiecare Tabelul 6 2 Tabel centralizator de calcul estimativ al costurilor utilizand un model matricial Proceduri (secvente) x Resurse Unitati medii consumate per Total Cost per Client client Tipul de resursa utilizata Unitate de masura Pret REBT unitar CT Fluoxetina REBT CT Fluoxetina Manopera timp (tarif orar) Psihoterapeut 1 h 6,59 s 20,98 h 20,41 h 0 h 138,25 134,49 0 s s s Psihiatru 1 h 8,09 s 0 h 0 h 6,95 h 0 s 0 s 56,25 s Psiholog clinician 1 h 4,56 s 0,33 h 0,33 h 0,33 h 1,51 s 1,51 s 1,51 s Asistent de cercetare 1 h 3,55 s 0,30 h 0,30 h 0,29 h 1,06 s 1,06 s 1,03 s Cheltuieli cu spatiu + 1 m2 1 h 0,16 s 274,74 267,64 102,95 43,52 42,39 16,31 s utilitati m2 h m2 h m2 h s s Consumabile 1 1,03 s 1,91 set 1,89 set 1,86 set 1,97 s 1,95 s 1,92 s FR test pers Licenta teste Manual client 0,36 s 1 1 1 manual 0,36 s 0,36 s 0,36 s manual manual Medicatie 1 doza = 1,27 s 0 doze 0 doze 159,65 0 s 0 s 202,31 s 20mg doze Medicatie de continuare 1 doza = 1,27 s 0 doze 0 doze 156,46 0 s 0 s 198,27 s 20mg doze Totalul cheltuielilor 186,66 181,76 477,95 s directe s s Regie (50% din totalul 93,33 90,88 238,97 s costurilor directe) s s Totalul costului 279,99 272,64 716,92 s serviciului s s Timpul clientului 1 h 6,13 s 32,10 h 31,25 h 18,00 h 196,78 191,50 110,35 s s s Costurile de transport 1 zi (drum 1,90 s 21,98 1 21,41 1 21,02 1 zi 41,78 40,70 39,95 s dus-intors) zi zi s s Totalul costului de 238,56 232,20 150,30 s oportunitate s s COSTUL TOTAL PE (Cost serviciu + Cost de oportunitate) pacient 518 55 504 84 867 22 s PACiENT s s COSTUL = Nr pacienti x Costul total pe pacient 29 557 28 271 49 431 s iNTERVENtiEi s s 1 373,09 s COSTUL = COSTUL iNTERVENtiEi Nr pacienti 703,75 724,90 TOTAL PACiENT recuperati s s RECUPERAT Explicitarea valorilor trecute in tabelul 6 2 ar necesita un spatiu editorial generos Detalii suplimentare pot fi consultate in Sava si colaboratorii (2009) Aici ne vom rezuma la a prezenta aleatoriu cateva dintre cele mai importante costuri estimate De exemplu, in coloana a patra se specifica o medie de 20,98 ore de psihoterapie de tip REBT urmate de un pacient din cele 23 maximum posibile (20 de ore din cadrul sedintelor regulate, fiecare constand in 50 de minute de discutii si 10 minute antemergatoare de pregatire din partea terapeutului, la care se adauga pana la un maximum de 3 ore in cadrul sedintelor suplimentare puse la dispozitie in perioada de urmarire) Tariful orar al psihoterapeutilor a fost stabilit la 6,59 USD, utilizand un principiu de echivalare bazat pe puterea de cumparare ca modalitate de transformare a costurilor din lei intr-o valuta cu circulatie internationala Nu sunt prevazute costuri pentru servicii de psihiatrie decat in grupul celor care primesc fhioxetina Costul fhioxetinei s-a stabilit pe baza pretului pietei, luand in calcul pretul cel mai mic obtinut in baza a trei oferte obtinute de la distribuitori ai acestui produs De asemenea, sunt prevazute costuri specifice pentru cei care au realizat evaluari psihologice periodice necesare pentru a urmari evolutia fiecarei persoane incluse in studiu in anumite faze ale evaluarii au participat psihologi clinicieni, iar in altele evaluarile au fost realizate de asistenti de cercetare Tarifele orare calculate se refera la venituri brute incluzand cheltuielile angajatorului si reprezinta fractiuni din venitul lunar mediu calculat la 168 de ore luna Costurile de regie se stabilesc procentual din totalul cheltuielilor directe necesare oferirii serviciului respectiv, fiind utilizate frecvent valori cuprinse intre 25% si 50% din totalul cheltuielilor directe in cazul respectiv, s-a utilizat valoarea de 50% in privinta costurilor de oportunitate s-au avut in vedere doar doua cheltuieli: cele legate de timpul pacientului (clientului) si de transport in cazul timpului pacientului, pe langa timpul efectiv destinat psihoterapiei, respectiv consilierii privind tratamentul medicamentos, se adauga timpul necesar pentru deplasarea inspre si de la locatia unde este livrat serviciul primit in cazul deplasarilor, s-au normat 21, cu una in plus fata de numarul de sedinte de consiliere psihoterapie urmate, fiind normata sedinta initiala de evaluare a situatiei in pretest in privinta costurilor implicate, tarifele specificate au fost cele utilizate Acolo unde nu sunt disponibile asemenea date, pot fi estimate preturile per unitate de masura, luand in calcul pretul pietei (de exemplu, cel mai mic pret in urma unei cereri a trei oferte) Pentru transformarea lor in unitati monetare cu circulatie internationala (de exemplu, euro sau dolari americani) se poate utiliza fie cursul de schimb mediu din perioada implementarii unui proiect, fie paritatea bazata pe puterea de cumparare (purchasing power parity) Caseta 6 1 Un model de chestionar de colectare a datelor privind costurile implicate Partea i Chestionar de monitorizare a resursei de timp (completat de terapeut, cu ajutorul informatiilor oferite de parintele insotitor) Numele copilului Nr A Timpul alocat de catre specialist C Timpul persoanei care C Alte costuri de sedintei insoteste copilul oportunitate A1 A2 A3 C1 C2 C3 D1 D2 Timpul de sedinta Managementul Teme sedinta Durata Costul Alte costuri de pregatire de cazului (min ) pentru de de deplasarii ingrijire (de (min ) terapie acasa terapie deplasare dus-intors exemplu, bona) (min ) (min ) (min ) (min ) sedinta 1 sedinta 2 sedinta n TOTAL Partea a il-a Chestionar de estimare a altor costuri de oportunitate (completat de parintele insotitor) 1 Sunteti angajat in prezent? a) Da, cu norma intreaga b) Da, cu norma partiala c) Nu, momentan nu lucrez d) Alta situatie, specificati care? 2 Estimati cu referire la ultimele doua luni, cat de mult timp v-a luat din timpul Dvs de munca sau din timpul Dvs liber sa rezolvati probleme ale copilului Dvs cum ar fi: i Vizite la scoala pentru a discuta cu profesorii directiunea probleme ale copilului Dvs a) deloc; b) 1-2 ore; c) 3-4 ore ; d) Mai mult de 4 ore Cate? ii Vizite la medic din cauza unor accidentari suferite de copilul Dvs a) deloc; b) 1-2 ore; c) 3-4 ore ; d) Mai mult de 4 ore Cate? 3 Ce cheltuieli ati avut in ultimele doua luni cu copilul Dvs (exprimati suma in lei sau incercuiti fara cheltuiala, dupa caz): e) Cheltuieli cu asistenta medicala si medicamente pentru tratarea ADHD sau pentru tratarea unor rani traumatisme determinate de neatentia hiperactivitatea copilului Dvs in valoare de  fara cheltuieli; f) Angajarea unui tutore privat pentru a face fata lectiilor de la scoala, cheltuieli in valoare de  fara cheltuieli; g) Cheltuieli cu acoperirea unor daune materiale produse de copilul Dvs in valoare de  fara cheltuieli Din cele prezentate referitoare la costuri rezulta cateva observatii si recomandari generale: (a) sub umbrela unui proces aparent riguros si obiectiv, precum este analiza cost-eficienta, se gasesc o serie de decizii subiective, unele cu impact semnificativ asupra rezultatelor obtinute (de exemplu, se ajunge la anumite costuri daca se apeleaza la tariful orar calculat ca fractiune din cele 168 de ore corespunzatoare unui salariu lunar si alte costuri daca tariful orar are in vedere valorile practicate in cabinete private de catre psihoterapeutii cu un prestigiu recunoscut); (b) ori de cate ori este posibil, se iau in calcul costurile reale ce au fost implicate, iar acolo unde acest lucru nu este posibil, estimarile trebuie sa fie realiste, bazate preponderent pe un studiu al pietei; (c) pentru a reflecta impactul unor asemenea decizii se recomanda ca rezultatul final obtinut sa fie supus unei analize de sensibilitate, ce consta in analiza robustetii rezultatului obtinut in contextul luarii in considerare a mai multor scenarii de costuri (de exemplu, care ar fi fost rezultatul daca tariful orar mediu al unei sedinte de psihoterapie ar fi fost de 20 de USD); (d) pentru o estimare adecvata a costurilor si resurselor, dincolo de problematica pretului, este esential sa se identifice clar toate secventele si resursele implicate (consumate) 6 2 2 Estimarea eficientei Estimarea eficientei se realizeaza pornind de la rezultatele (efectele) pe care serviciul implementat le-a avut in urma derularii studiului respectiv Daca studiul are in vedere eficienta unor interventii pentru reducerea greutatii corporale, atunci eficienta vizeaza kilogramele reduse Daca interventia isi propune sa reduca nivelul de epuizare emotionala, eficienta vizeaza intensitatea scaderii punctajului dinspre un nivel care indica un nivel intens de burnout spre un nivel scazut sau foarte scazut al nivelului de burnout Daca programul vizeaza prevenirea fumatului in randul adolescentilor, efectul urmarit ar putea fi numarul de adolescenti avertizati (informati) in schimb, daca programul vizeaza renuntarea la fumat, efectul ar putea fi numarul de adolescenti fumatori care au renuntat la acest viciu Prin urmare, in alegerea indicatorilor utilizati pentru a masura eficienta unei interventii, un loc central il revine obiectivului urmarit prin interventia respectiva Prima masura utila cu referire la analiza comparativa a eficientei unor interventii psihologice este oferita de rezultatele statistice clasice Daca sunt identificate diferente semnificative statistic intre interventii, putem concluziona ca nu au acelasi nivel de eficienta De asemenea, daca diferentele dintre grupele comparate nu sunt semnificative statistic, iar distantele dintre mediile grupelor sunt mici, se poate spune ca serviciile comparate au acelasi nivel de eficienta (vezi referirile din capitolul 4, tabelul 4 4, privind demonstrarea non-inferioritatii sau a echivalentei eficientei diferitelor forme de interventie) Dincolo de aceasta analiza initiala, se apeleaza frecvent la transformarea scorurilor brute intr-o alta forma cu sens practic inclusiv pentru nespecialisti De exemplu, in cazul depresiei, pentru oamenii de decizie nespecialisti in problematica sanatatii mentale, un scor de 15 la o proba clasica de depresie nu are multa semnificatie Ei sunt interesati, mai degraba, de exprimarea unor rezultate direct legate de scopul urmarit al programului de interventie Pentru ei nu conteaza punctajul brut obtinut, ci daca in urma interventiei individul a fost recuperat sau nu, daca mai sufera sau nu de depresie De aceea, ori de cate ori efectul urmarit nu reprezinta un rezultat important pentru comunitate (cum ar fi: recidiveaza sau nu; este sanatos sau nu; pleaca sau nu din companie in cel mult un an de la angajare etc ), se apeleaza la acest pas de transformare a rezultatelor brute in expresii cu sens recunoscut la nivel social De exemplu, in studiul amintit (Sava et al , 2009), eficienta a fost masurata prin scorurile la scala de depresie Beck, insa acestea au fost transformate in rezultate cu sens, cum ar fi numarul de zile fara simptomatologie depresiva (depression free days) La un astfel de output se poate ajunge apeland la urmatorii pasi standard: (a) raportarea scorurilor brute la etalonul probei pentru a vedea care dintre persoane mai sufera de simptomatologia specifica depresiei majore; (b) transformarea pe baza unui algoritm precum interpolarea liniara a intensitatii simptomelor in numar de zile cu manifestari depresive in cazul respectiv, consultand etalonul probei Beck (David, 2006), se observa ca scoruri la BDi 29 inseamna o simptomatologie depresiva severa Valorile cuprinse intre aceste limite indica prezenta unei simptomatologii depresive dinspre depresie usoara spre depresie moderata Pornind de la aceste valori standard, s-a utilizat urmatorul algoritm de transformare in zile fara simptomatologie depresiva, luand ca reper o perioada de 30 de zile Celor care au obtinut un scor BDi 29 li s-a atribuit o pondere egala cu 0 Utilizand aceeasi asumptie a mentinerii constante a starii mentale pentru ultimele 30 de zile, se ajunge, in cazul lor, la 0 zile fara simptomatologie depresiva sau la 30 de zile cu depresie Pentru scorurile BDi cuprinse intre 8 si 28 se poate stabili numarul de zile fara simptomatologie depresiva cu ajutorul unei simple operatii de interpolare liniara De exemplu, in cazul unei persoane care avea un scor BDi de 10, ponderea acordata este de 0,86 in baza formulei folosite Pentru calcularea numarului de zile arondate fara simptomatologie depresiva, se inmulteste aceasta pondere cu perioada de timp luata in calcul (in acest caz 30 de zile), obtinandu-se 25,8 zile fara simptomatologie depresiva raportate din cele 30 de zile anterioare momentului evaluarii, acest lucru fiind atribuit unei persoane cu un scor BDi = 10 Desigur, un asemenea algoritm de lucru este necesar atunci cand variabila dependenta principala este masurata numeric si este exprimata intr-o forma mai putin inteleasa de catre publicul larg si de catre decidentii programelor educationale sau de sanatate vizate (vezi discutia arondata tabelului 4 6 din capitolul 4, cu privire la distinctia dintre VD surogat si cele reale) ipotetic, exista alte trei posibile scenarii: (a) variabile-surogat masurate dihotomic (intentioneaza sau nu sa paraseasca compania); (b) variabile reale masurate dihotomic (fluctuatia reala observata operationalizata dihotomic: a plecat sau nu din companie); (c) variabile reale masurate numeric (volumul lunar al vanzarilor realizate) in cazurile cu VD brute exprimate intr-o maniera dihotomica (a si b), nu se preteaza utilizarea interpolarii liniare, iar in cazurile cu VD reale (b si c) nu este necesar pasul de transformare a rezultatului brut in alte expresii, deoarece la nivel social asemenea rezultate (fluctuatia de personal, volumul lunar al vanzarilor etc ) au sens in mod direct Desi nu exista un singur indicator de exprimare a eficientei unui serviciu psihologic, cel putin in zona interventiilor psihologice cu aplicabilitate in domeniul clinic si al sanatatii se utilizeaza frecvent un indicator temporal (cantitativ) al problematicii investigate, cum ar fi zilele fara simptomatologie depresiva, zilele fara simptomatologie ADHD etc Exista cel putin doua avantaje majore ale utilizarii unui asemenea indicator (Vannoy et al , 2010): (a) faciliteaza realizarea altor tipuri de analize economice cum ar fi analiza cost-utilitate (deoarece indicatorul cantitativ de timp cu fara simptomatologie este un pilon important in calcularea indicatorilor standard tipici in asemenea analize, cum este QALY (quality adjusted life years); (b) faciliteaza scorurile agregate ale eficientei unei interventii atunci cand VD este masurat la diferite intervale de timp (de exemplu, inainte, imediat dupa interventia cu o durata de trei luni, dar si la sase, respectiv 12 luni de la finalizarea interventiei, ca perioada de urmarire a stabilitatii efectelor) Eficienta unui program este egala cu media ponderata a eficientei (de exemplu, numarul ZFS calculat pentru fiecare individ in parte care a urmat acel program), asa cum se observa in caseta 6 2 Caseta 6 2 Exemple concrete de calcul a zilelor fara simptomatologie (ZFS) in cazul in care sunt patru evaluari: inainte de implementarea unei interventii cu durata de 3 luni (T0), imediat dupa finalizarea interventiei (T1 = T0 + 3 luni), in perioada de urmarire la 3 luni de la finalizarea interventiei (T2 = T1 + 3 luni) si in perioada de urmarire la 9 luni de la finalizarea interventiei (T3 = T2 + 6 luni), intensitatea simptomatologiei conduce la anumite ponderi utilizate in calculul pentru stabilirea numarului de zile fara simptomatologie (ZFS) Asa cum am amintit, aceste ponderi sunt cuprinse intre 0 (daca problema a fost rezolvata) si 1 (daca problema este una severa) in toate perioadele urmarite se poate calcula o pondere medie in baza evaluarilor existente in acea perioada De exemplu, pentru a afla numarul ZFS dintre T0 si T1, se calculeaza media celor doua ponderi obtinute cu ocazia primelor doua evaluari si se inmulteste acest rezultat cu perioada avuta in vedere (in acest caz, 90 de zile) De exemplu, daca un participant intr-un studiu primeste ponderea 0 (simptomatologie severa) la momentul T0, respectiv ponderea 1 (recuperare completa) la momentul T1, se obtine o medie de 0,50 care inmultita cu perioada de 90 de zile inseamna 45 de ZFS in cazul sau Daca exista mai mult de doua evaluari in intervalul avut in vedere (de exemplu, se doreste stabilirea numarului de ZFS dintr-un an de zile, cu cele patru momente de evaluare), formula devine: ZFS = 365 zile x [(0,125 x ZFS T0) + (0,250 x ZFS T1) + (0,375 x ZFS T2) + (0,250 x ZFS T3)] Spre exemplificare, ponderea de 0,125 pentru T0 este determinata prin faptul ca rezultatele acestei evaluari reprezinta jumatate din evaluarea unei singure perioade cu durata de 3 luni (durata ce reprezinta 25% dintr-un an, intre T0 si T1) Ponderea de 0,375 acordata lui T2 rezulta din insumarea lui 0,125 (jumatate din perioada de 3 luni cu pondere 0,250 dintre T1 si T2) si 0,250 (jumatate din perioada de 6 luni cu pondere de 0,500 dintr-un an, dintre T2 si T3) insumate, toate aceste ponderi trebuie sa fie egale cu 1,00, valorile lor fiind stabilite in functie de numarul de evaluari existente si de distanta temporala dintre evaluari raportata la durata totala a perioadei avute in vedere De exemplu, daca ar fi avut loc doar trei evaluari, T0, T1 si T2 cu o durata totala a perioadei analizate de 6 luni, formula devine ZFS: 182 de zile x [(0,25 x ZFS T0) + (0,50 x ZFS T1) + (0,25 x ZFS T2)] Exista o serie de neajunsuri ale acestui model, cel mai important fiind vulnerabilitatea asumptiei ca modificarea simptomatologiei are o forma liniara De exemplu, intre T0 si T1 se considera ca are loc o imbunatatire continua, desi in realitate ar putea fi vorba de o evolutie neliniara, cu scenarii multiple: (a) scenariul ameliorarii produse abia spre finalul perioadei, ceea ce ar presupune o supraestimare a ZFS; (b) scenariul in care evolutia este una curbilinie, dupa inceperea terapiei fiind o perioada de intensificare a simptomelor, iar abia apoi apare o ameliorare (acelasi risc de supraestimare a ZFS); (c) scenariul evolutiei ciclice, cu o ameliorare a simptomatologiei intre masuratori ramasa nesurprinsa, insotita de o recadere in apropierea Ti (efect de supraestimare a ZFS) Aceste critici sunt cu atat mai indreptatite cu cat exista o distanta temporala mai mare intre momentele evaluarii, indeosebi intre TO si Ti, in care se ofera interventia O solutie partial compensatorie consta in restrangerea perioadei de transformare a ZFS cu scopul de a minimiza distorsiunile De exemplu, Sava et al (2009) ia in calcul un interval limitat de 30 de zile anterioare momentului evaluarii pentru calculul ZFS (ZFS pentru 30 de zile anterioare lui TO; ZFS pentru 30 de zile anterioare lui Ti - masurat la 3 luni distanta fata de T0, ZFS pentru 30 de zile anterioare lui T2, masuratoare facuta la 6 luni distanta fata de Ti) in acest caz, se compara valorile ZFS lunare inainte (T0), imediat dupa interventie (Ti) si la sase luni de la finalizarea interventiei (T2), fara a se calcula un ZFS total pentru toata perioada in sfarsit, modalitatea de calcul a eficientei unei interventii se complica daca nu exista clar o VD principala De exemplu, din perspectiva unui program finantat de stat pentru recuperarea dupa un traumatism sever al mainii si al antebratului, din perspectiva psihosociala, pe langa reducerea distresului emotional (depresie si sau anxietate), poate fi foarte importanta o reintegrare profesionala cat mai rapida in asemenea cazuri, desi avem un singur cost, pot exista multiple rezultate pozitive in asemenea situatii, se pot calcula separat analize de tip cost-eficienta pentru fiecare beneficiu major sau se poate calcula un indicator agregat al eficientei in functie de ponderea acordata fiecarui efect urmarit in exemplul oferit, daca programul psihoterapeutic urmarit are ca obiectiv reducerea distresului emotional, se pot acorda urmatoarele ponderi: 0,40 pentru depresie, 0,40 pentru anxietate si 0,20 pentru reintegrare profesionala, dupa care se poate obtine si o valoare globala a ZFS, utilizand ponderile respective (vezi Yates, 1999) 6 2 3 Analiza cost-eficienta Dupa estimarea costurilor implicate si a eficientei serviciilor psihologice se pot asambla cele doua componente pentru a realiza o analiza de tip cost-eficienta Unitatea de baza este raportul cost-eficienta, in cadrul careia cu cat costurile per unitate de eficienta sunt mai reduse, cu atat interventia analizata are un raport cost-eficienta mai bun in principiu, daca interventia A are un raport cost-eficienta pentru o zi fara simptomatologie (de 20 USD ZFS) sau pentru un an fara simptomatologie (AFS) (de 7 300 USD AFS), se poate spune ca ea este superioara interventiei В sub raport cost-eficienta, daca raportul cost-eficienta al acesteia este de 50 USD ZFS, respectiv de 18 250 USD AFS in general, se poate vorbi despre trei tipuri de analiza cost-eficienta: (a) analiza mediei raportului cost-eficienta (ACER - average cost-effectiveness ratio) care se aplica atunci cand se compara eficienta unei interventii cu situatia absentei interventiei respective (comparatia dintre pretest si posttest, respectiv comparatia dintre grupul care primeste interventia si un grup de control pasiv); (b) analiza raportului marginal cost-eficienta (MCER -marginal cost-effectiveness ratio), care vizeaza acelasi lucru in conditiile varierii costurilor ca urmare a extinderii sau reducerii unui program; (c) si analiza raportului incremental cost-eficienta (iCER - incremental cost-effectiveness ratio), aplicabila atunci cand sunt comparate doua sau mai multe interventii active intre ele (Denii et al , s a ) in cazul ACER, de exemplu, se vorbeste despre un raport cost-eficienta pentru fiecare ZFS obtinuta in plus ca urmare a interventiei Bunaoara, in cazul unei interventii care a costat 500 USD client si care a condus la un castig de 20 de ZFS, de la 3 ZFS inainte de interventie la 23 ZFS dupa interventie), raportul mediu cost-eficienta ar fi de 25 USD ZFS castigata, respectiv de 9 125 USD AFS castigat Aceste rezultate prezentate constituie valori descriptive medii obtinute Daca asemenea raporturi sunt calculate la nivel individual, pentru fiecare persoana inclusa in cercetare, luand in calcul costurile si eficienta observata pentru fiecare persoana evaluata, se poate apela la tehnici statistice inferentiale clasice, pentru a testa daca exista sau nu diferente semnificative statistic in privinta raportului cost-eficienta intre anumite forme de interventie De exemplu, in studiul realizat de Sava et al (2009), utilizand o asemenea strategie, s-a constatat ca apelul la psihoterapie, fie ea sub forma REBT (M = 23,77 USD ZFS castigata), sau СТ (M = 26,22 USD ZFS castigata), conduce la un raport cost-eficienta semnificativ mai scazut decat in cazul apelului la medicatie (M = 34,93 USD ZFS castigata) Analizele post hoc nu au gasit diferente semnificative intre cele doua forme de psihoterapie in anumite situatii se poate apela la analize de tip MCER, pentru a urmari impactul asupra raportului cost-eficienta, daca anumite componente implicate in calculul costurilor se modifica semnificativ De exemplu, in cazul tratamentului cu fluoxetina este posibil sa scada costurile pe persoana cu medicatia in cazul in care in loc de 50 de clienti sunt tratate 500 de persoane, datorita posibilitatii de a negocia un pret mai bun pentru medicamente in cazul unui volum solicitat de 10 ori mai mare decat in cel utilizat pentru a calcula costul medicatiei in schimb, daca pretul psihoterapiei, asa cum a fost el calculat ca fractiune din venitul salarial lunar nu s-ar reduce, ar putea afecta rezultatul raportului cost-eficienta mentionat anterior Analizele MCER au in vedere asemenea situatii Totusi, acest gen de analiza este rar intalnit, fiind preferata includerea variatiilor posibile de costuri si a implicatiilor acestora in analize de sensibilitate, descrise in sectiunea 6 2 5 O strategie frecvent intalnita in analiza raportului cost-eficienta, valabila pentru programe concurente, este aceea de a calcula un raport incremental cost-eficienta (iCER) (Phillips, 2009) Formula in acest caz este raportul dintre diferenta de costuri dintre doua interventii (C2 - C1) si diferenta de eficienta dintre aceleasi doua interventii (E2 - E1) in cazul in care se compara mai mult de doua interventii, inainte de utilizarea formulei respective se ierarhizeaza interventiile in ordine crescatoare a eficientei lor (vezi exemplul ipotetic al tabelelor 6 3 si 6 4) Revenind la exemplul nostru privind studiul asupra depresiei majore, din tabelul 6 3 se observa ca apelul la terapie cognitiva (CT) conduce la un iCER cu semn negativ Acest lucru inseamna ca adoptarea CT fata de interventia precedenta (fluoxetina), conduce la obtinerea unui efect incremental (mai multe ZFS) cu bani mai putini Prin urmare, fluoxetina este eliminata din analiza, procesul stabilirii raporturilor iCER reluandu-se intr-o maniera iterativa cu celelalte interventii ramase (vezi tabelul 6 4) Tabelul 6 3 Raporturile iCER (raporturile incrementale cost-eficienta) Pasul 1 interventie Cost Efect (eficienta) A Costuri A Eficienta iCER (AC AE) imipramina 495 USD om 15 ZFS castigate lunar 495 USD 15 33 Fluoxetina 665 USD om 18 ZFS castigate lunar 170 USD 3 21,66 CT 505 USD om 19 ZFS castigate lunar -160 USD 1 -160 REBT 532 USD om 20 ZFS castigate lunar 27 USD 1 27 Tabelul 6 4 Raporturile iCER (raporturile incrementale cost-eficienta) Pasul 2 interventie Cost Efect (eficienta) A Costuri A Eficienta iCER (AC AE) imipramina 495 USD om 15 ZFS castigate lunar 495 USD 15 33,0 CT 505 USD om 19 ZFS castigate lunar 10 USD 4 2,5 REBT 532 USD om 20 ZFS castigate lunar 27 USD 1 27,0 in urma analizei din tabelul 6 4 va fi eliminata si alternativa imipraminei, deoarece aceasta este mai putin eficienta decat CT (15 vs 19 ZFS) si costa mai mult pentru a produce un ZFS suplimentar (33 vs 2,5) in sfarsit, in tabelul 6 5 sunt analizate comparativ cele doua programe ramase in cursa, CT si REBT Tabelul 6 5 Raporturile iCER (raporturile incrementale cost-eficienta) Pasul 3 interventie Cost Efect (Eficienta) A Costuri A Eficienta iCER (AC AE) CT 505 USD om 19 ZFS castigate lunar 505 USD 19 26,57 REBT 532 USD om 20 ZFS castigate lunar 27 USD 1 27,00 Din tabelul 6 5 se observa ca ambele programe au raporturi cost-eficienta similare Astfel, cu toate ca REBT pare a avea o eficienta suplimentara (20 ZFSvsl9ZFS), costul per unitate suplimentara de eficienta este de asemenea usor mai ridicat (27 vs 26,57) in asemenea conditii, se poate concluziona ca cele doua programe au niveluri similare ca raport cost-eficienta, recomandarea de a utiliza una sau alta dintre formele de interventie fiind dependenta de bugetul avut la dispozitie Daca bugetul este suficient de generos pentru a acoperi cheltuielile tuturor cazurilor de depresie majora, recomandarea ar putea merge catre REBT, datorita plusului de eficienta (daca exista diferente semnificative statistic in privinta eficientei celor doua forme de interventie) Daca asemenea diferente nu exista sau daca bugetul nu permite acoperirea tuturor cazurilor de depresie majora, se alege interventia cu costuri mai reduse (daca exista o diferenta semnificativa statistic sub raportul costurilor implicate) in cazul in care ambele programe au niveluri similare de costuri, respectiv de eficienta, se poate apela la oricare dintre cele doua forme de interventie 6 2 4 ilustrarea unei analize cost-eficienta in domeniul organizational Exemplul ales este al determinarii celei mai bune modalitati de instruire a noilor angajati dintr-o companie multinationala aflata in extindere, cu scopul de a obtine o integrare cat mai rapida a lor la locul de munca (de obicei, noii angajati au nevoie de o perioada de acomodare pana sa ajunga la un nivel maxim de productivitate - operationalizata prin atingerea sau chiar depasirea normei zilnice) Desi acest gen de studii se preteaza si la analize de tip cost-beneficiu, ne vom rezuma in aceasta sectiune la o analiza de tip cost-eficienta Criteriul ales pentru eficienta este numarul de zile in care norma a fost atinsa pe o perioada de urmarire de trei luni de zile, cu patru perioade de evaluare: in a prima zi efectiva de munca, in a 15-a zi, in a 30-a zi si in ultima zi supusa monitorizarii, a 90-a Cele trei variante supuse analizei de cost-eficienta au fost urmatoarele: (a) 3 zile de training de initiere, fiecare cu durata de 8 ore pe zi, sustinute de personal propriu (serviciu intern); trainingul s-a derulat imediat dupa angajare, fiind necesare 10 asemenea sedinte de instruire (grupuri de cate 10) pentru a-i integra pe cei 100 de noi angajati; (b) 2 zile de training de initiere, fiecare cu durata de 8 ore pe zi, sustinute de traineri externi (serviciu externalizat), imediat dupa angajare, fiind estimate tot 10 asemenea sedinte de instruire (grupuri formate din 10 persoane, totalizand 100 de noi angajati); (c) on site training (desemnarea unor colegi experimentati care sa-i instruiasca individual pe noii angajati la locul lor de munca, timp de o ora zi lucratoare in prima luna, respectiv timp de 15 minute zi lucratoare in lunile 2-3; sunt estimate 21 de zile lucratoare si 100 de noi angajati) 6 2 4 1 Determinarea costurilor Daca ne referim, ilustrativ, la programul de instruire cu traineri interni, am putea include in cadrul costurilor directe de personal (1): (a) veniturile angajatilor desemnati sa tina acest training, fractionat ca timp de lucru pe care il petrec pentru a derula sesiunile respective, dar si pentru a pregati materialele de instruire ; (b) veniturile nou-angajatilor pe durata implicarii lor in training, fiind vorba de timpi neproductivi); (c) veniturile echipei de suport, fractionat in functie de durata de timp alocata de acestia pentru pregatirea celor necesare trainingului (personal administrativ etc ); (d) costul eventual al unor servicii de consultanta, daca este cazul in cazul veniturilor salariale se iau in considerare veniturile brute la care se adauga cheltuielile angajatorului Tot in categoria costurilor directe avem cheltuielile logistice (2) (de exemplu, inchirierea aparaturii audio-video, flip-chart, hartie, costuri pentru multiplicare, inchirierea spatiului etc , fiecare dintre acestea fiind determinate in mod realist, tinand cont de conditiile existente in firma care implementeaza sesiunile de training) A treia categorie importanta de costuri directe posibile sunt costurile referitoare la mobilitati (3) Aici ar intra costurile cauzate de eventuala decizie de a tine aceste intalniri in alte locatii (cazare, masa, transportul persoanelor si echipamentelor, dupa caz) Pe baza acestor cheltuieli directe, in functie si de elementele incluse sau excluse, se poate stabili si o anumita valoare a costurilor de regie, stabilite ca procent din cheltuielile directe amintite mai sus, valoarea acesteia fiind adesea cuprinsa intre 25% si 50% (cuprinzand, dupa caz, costurile cu utilitatile, personalul administrativ, echipamentele puse la dispozitie etc ) in general, valorile cheltuielilor de regie sunt mai mici daca unii dintre itemii mentionati anterior au fost inclusi printre cheltuielile directe La toate aceste cheltuieli se adauga si cheltuielile de oportunitate (cum ar fi pierderile in productivitate cauzate de implicarea celor instruiti, dar si a celor care instruiesc, intr-o activitate care nu este direct productiva) Tabelul 6 6 Estimarea costurilor implicate in cele trei programe de instruire (date ipotetice) Unitati medii consumate per client Totalul costului per c Tipul de resursa utilizat Unitate de masura Pret unitar s Training externalizat Training intern On site training Training externalizat Training intern O tr Manopera timp (tarif orar) Angajat trainer 1 h persoana * 0,60 s 0 h 26 h ** 0 h 0 s 15,60 s 0 Trainer extern 1 h persoana * 8,00 16 h 0 h 0 h 108,00 s 0 s 0 s Supervizor on 1h 5,00 0 h 0 h 25,25 h 0 s 0 s 1 site s s Angajat instruit 1h 4,50 16 h 24 h 25,25 h 72,00 s 108,00 1 s s s inchirierea 1 20,00 1 sala 1 sala 0 sali 20,00 s 20,00 s 0 spatiului cu dotat sala training persoana s cu aparatura * necesara Cheltuieli cu 1 pauza persoana 2,00 4 pauze 6 pauze 0 pauze 8,00 s 12,00 s 0 pauza de cafea s Consumabile - 1 set persoana 5,00 1 set 1 set 0 seturi 5,00 s 5,00 s 0 dosar de training s Cheltuieli cu 1 masa persoana 5,00 2 mese 3 mese 0 mese 10,00 s 15,00 s 0 masa de pranz s 223,00 s Totalul cheltuielilor directe (CD) 175,60 s 2 s Regie (25% din 55,75 s 43,90 s 5 CD) Totalul costului serviciului 278,75 s 219,50 2; s s Costul pierderii 1 h persoana 4,50 16 h 24 h 25,25 h 72,00 s 108,00 1 de s s s pro ductivitate *** Cheltuieli factura persoana 17,28 0 1 1 0 s 17,28 s 1 deductibile - s nefacturat nefacturat nefacturat manopera Cheltuieli factura persoana 6,88 0 0 1 0 s 0 s 6 deductibile - s nefacturat nefacturat nefacturat logistica Totalul costului 72,00 s 125,28 1 de oportunitate s s COSTUL (Costul serviciului + 350,75 s 344,78 4 TOTAL PE Costul de s s ANGAJAT oportunitate) CLiENT COSTUL = Nr oamenilor 35 075 s 34 478 4 iNTERVENtiEi instruiti x Costul total pe angajat instruit s s Am calculat cat revine costurilor cu inchirierea salii de training dotate corespunzator, raportata la o singura persoana (fiind instruite cate 10 persoane per training), pentru a permite raportarea cheltuielilor per individ Acelasi lucru a fost facut si pentru traineri (in cadrul cheltuielilor cu manopera, cu exceptia cazului de training on site, in care instruirea s-a facut individual), precum si pentru cheltuielile facturate care reduc valoarea impozitului pe profit (provenite din facturarea cheltuielilor cu trainerul extern si a celor logistice, calculate la 16%) ** in cazul instructorilor angajati interni, pe langa cele 24 de ore cumulate de training realizate efectiv in cele 3 zile de instruire au fost adaugate alte 2 ore persoana ca urmare a unei estimari a 200 ore de munca pentru conceperea si pregatirea trainingului derulat pe cele 100 de persoane *** in estimarea pierderilor legate de productivitate s-a tinut cont de cheltuielile in regim plata cu ora, activitatile derulate in perioada de instruire fiind delegate catre alti colegi Nu am luat in calcul, desi ar fi fost cazul, diferentele cauzate de eficienta diferita a celor trei programe de instruire 6 2 4 2 Determinarea efectelor Obiectivul principal al programelor de instruire era de a reduce perioada de acomodare a noilor angajati astfel incat ei sa atinga performantele cerute in cadrul companiei (norma stabilita) Prin urmare, firesc ar fi ca principalul efect urmarit sa fie reprezentat de numarul de zile, din cele 90 cuprinse in perioada de monitorizare, in care noii angajati reusesc sa-si atinga norma Rezultatele medii pentru cele trei programe au fost: 54 de zile pentru cei care au fost beneficiarii instruirii furnizate ca serviciu externalizat, 52 de zile pentru cei instruiti de formatori interni, respectiv 63 de zile pentru cei care au urmat un programul de formare la locul de munca (on site) Acestor date li se adauga o statistica provenita de la alti 25 de angajati noi, care din diverse motive nu au urmat niciuna dintre formele de instruire Acestia au atins norma de productie stabilita in 40 de zile din cele 90 de zile stabilite, fara a implica vreun cost specific de instruire 6 2 4 3 Analiza cost-eficienta Sintetizand datele prezentate anterior in tabelul 6 7, pot rezulta mai multe tipuri de analiza cost-eficienta Una dintre cele mai frecvente analize este cea a raportului incremental cost-eficienta, utila pentru a compara mai multe programe alternative intre ele Consultand datele din tabelul 6 7, se constata ca varianta externalizarii serviciului de instruire comparativ cu alternativa precedenta (trainingul intern) se dovedeste a fi mai eficienta (exista un efect incremental de 2 zile) in conditiile unui cost zi suplimentara castigata mai redus (2,98 fata de 6,74) Dupa eliminarea alternativei de training intern (si a absentei oricarei interventii care nu este inclusa intr-o analiza de tip iCER), in tabelul 6 8 putem urmari care dintre cele doua alternative ramase in cursa are cel mai bun raport cost-eficienta Tabelul 6 7 Raporturi iCER (costul instruirii per zi cu norma indeplinita) interventie Cost Efect (eficienta) A Costuri A Eficienta iCER (AC AE) Absenta 0 USD 40 de zile Training intern 344,78 USD 52 de zile 344,78 USD 12 de zile 28,73 Serviciu externalizat 350,75 USD 54 de zile 5,97 USD 2 zile 2,98 instruire on site 437,61 USD 63 de zile 86,86 USD 9 zile 9,65 * Valorile iCER se calculeaza pentru a compara interventiile active Absenta programului de instruire se utilizeaza doar in calculul ACER (raportul clasic cost-eficienta) Conform acestuia, surplusul de 12 zile cu norma indeplinita prin instruire cu formatori interni costa 344,78 USD om, adica 28,73 USD zi in plus in care s-a indeplinit norma Surplusul de 14 zile, in cazul externalizarii serviciului de instruire, are un cost de 350,75 USD om instruit, adica 25,05 USD zi in plus de indeplinire a normei in sfarsit, cele 23 de zile suplimentare cu norma indeplinita obtinute prin training on site costa 437,61 USD om, adica 19,02 USD zi suplimentara cu norma indeplinita Din analiza pare a rezulta ca instruirea on site are cel mai bun ACER Pentru a fi siguri de acest lucru, se utilizeaza tehnici statistice comparative pentru a stabili daca exista diferente semnificative statistic sau se apeleaza la analize iCER Tabelul 6 8 Raport iCER (costul instruirii per zi suplimentara cu norma indeplinita) interventie Cost Efect (Eficienta) A Costuri A Eficienta iCER (AC AE) Serviciu externalizat 350,75 USD 54 de zile 350,75 USD 54 de zile 6,38 instruire on site 437,61 USD 63 de zile 86,86 USD 9 zile 9,65 Conform acestui tabel, cele doua interventii au un nivel similar al raportului cost-eficienta Desi instruirea la locul de munca are o eficienta mai ridicata (exista 9 zile suplimentare cu norma intreaga), costurile pe fiecare zi suplimentara cu norma indeplinita sunt ceva mai mari (9,65 USD) fata de situatia apelului la un program de instruire initial oferit de traineri externi (6,38 USD) Reamintim ca, in aceasta analiza iCER, un program are un raport cost-eficienta mai bun decat precedentul cu care este comparat in doua situatii: (a) daca are o valoare iCER negativa (costa mai putin si are un efect mai bun) sau (b) daca indeplineste o valoare iCER mai mica decat programul cu care este comparat si are in acelasi timp o eficienta mai buna (cu alte cuvinte, daca are un efect mai puternic si un cost efect incremental mai scazut) 6 2 5 Analiza de sensibilitate Orice raport cost-eficienta poate varia mult in functie de costurile utilizate Sa ne gandim numai la un singur aspect: cum ar fi evoluat analizele daca tariful pentru trainingul extern ar fi fost de 10 USD ora in loc de 8 USD ora? Costul total al interventiei ar fi crescut cu 40 de USD om, ajungandu-se la un cost de 390,75 USD om, respectiv la un raport iCER de 22,98 in cadrul tabelului 6 7 in acest caz nu s-ar mai fi putut distinge intre programele de instruire intern si extern in schimb, analiza ar fi aratat ca instruirea la locul de munca are un raport cost-eficienta mai bun decat instruirea bazata pe serviciul externalizat, avand o eficienta mai buna si un raport iCER mai redus s a m d in consecinta, data fiind importanta identificarii categoriilor de cost relevante si a pretului corect pentru acestea, se recomanda prezentarea intervalelor de incredere asociate rezultatelor, cel putin cu privire la raportul cost-eficienta, fie el exprimat ACER sau iCER (Yates, 1999; Phillips, 2009) Forma incipienta a analizei de sensibilitate presupune utilizarea intervalelor de incredere, posibil de calculat daca datele sunt colectate individual cu privire la costurile interventiei si sau la efectele observate in aceasta directie vor fi favorizate programele cu efecte constante in dauna celor cu rezultate eterogene, deoarece vor conduce la intervale de incredere cu amplitudine mai mica Aceste intervale de incredere pot fi stabilite si prin apelul la tehnica bootstrap Formele intermediare ale analizei sensibilitatii urmaresc implicatiile diferitelor asumptii asupra rezultatelor evaluarii Aici intra efectul contextului (de exemplu, perioada de timp avuta in vedere: se obtin aceleasi rezultate daca analiza se face pe 60 de zile in loc de 90 de zile?; numarul de persoane instruite: cum ar evolua costurile per participant daca ar fi instruiti doar 50 in loc de 100 de noi angajati?) De asemenea, aici intra analiza impactului diferitelor costuri asupra rezultatului analizei: "Cum ar evolua costurile celor doua programe care necesita spatiu special de instruire daca acesta, impreuna cu echipamentele necesare, sunt accesate gratuit de catre companie?", "Cum ar evolua rezultatele daca instruirea la locul de munca ar fi condensata in doar 45 de minute zi in prima luna si cate 10 minute zi in celelalte doua luni, adica ar dura cu sase ore mai putin (19,25 fata de 25,25 ore)?" s a m d Asa cum am precizat la inceputul sectiunii 6 2 3, acest tip de analiza implica apelul la MCER (marginal cost-effectiveness analysis), centrata pe optimizarea costurilor ca urmare a modificarii (extinderii sau reducerii) unui serviciu analizat in sfarsit, in forma sa avansata (Phillips, 2009), analiza de sensibilitate implica o analiza de probabilitati pentru a stabili curba de acceptabilitate a raportului cost-eficienta Valorile costurilor si cele ale efectelor sunt utilizate pentru a genera esantioane noi (de obicei 1 000 de noi esantioane), obtinandu-se pentru fiecare esantion un raport cost-eficienta in functie de aceste valori se stabileste o probabilitate de obtinere a unui anumit raport cost-eficienta De exemplu, fie o probabilitate de 0,25 ca raportul cost-eficienta (ACER) sa fie de cel mult 100 USD zi castigata cu norma intreaga, respectiv o probabilitate de 0,98 ca raportul sa fie de cel mult 300 USD zi castigata cu norma indeplinita (curba de acceptabilitate implica valorile CER pe abscisa si probabilitatile pe ordonata) interpretarea se face prin raportarea la anumite valori standard (benchmarks), considerate a fi acceptabile De pilda, daca conducerea companiei considera ca nivelul maxim al costului suportat pentru o zi cu norma intreaga este de 250 USD, iar probabilitatea de a avea un asemenea raport este de 0,90, exista sanse de a accepta interventia respectiva, deoarece exista de 9 ori mai multe sanse ca interventia sa aiba un raport cost-eficienta acceptabil decat unul inacceptabil in schimb, daca conducerea este dispusa sa plateasca maximum 100 USD zi castigata cu norma indeplinita, programul nu va fi adoptat, fiind o probabilitate scazuta (0,25) ca raportul cost-eficienta sa fie in limitele acceptabile, de cel mult 100 USD (altfel spus, sunt de patru ori mai putine sanse ca interventia sa aiba un raport cost-eficienta acceptabil decat unul inacceptabil) Mai multe detalii despre ce presupune analiza de sensibilitate sunt prezentate intr-un limbaj accesibil nespecialistilor in Taylor (2009) 6 3 Analiza cost-utilitate Analiza cost-utilitate se apropie mult de analiza cost-eficienta Atat costurile, cat si diferitele raporturi de tip cost-utilitate (de exemplu, iCER) sunt similare cu cele intalnite in cazul analizei cost-eficienta Ceea ce difera este efectul masurat intr-o analiza cost-utilitate (CUA - cost-utility analysis) efectul este standardizat, ceea ce permite comparatii intre interventii, chiar daca acestea se refera la probleme diferite (Yates, 1999; McCabe, 2009; Whitehead si Shehzad, 2010) De exemplu, prin analize de tip cost-utilitate se poate urmari care dintre urmatoarele interventii are un raport cost-utilitate mai bun: (a) terapia cognitiv-comportamentala pentru combaterea depresiei majore; (b) utilizarea hipnoterapiei pentru reducerea durerii postoperatorii sau (c) coaching-ul directiv pentru reducerea nivelului de burnout la angajati Acest avantaj al CUA este important atunci cand exista constrangeri de natura bugetara care nu permit finantarea simultana a tuturor acestor programe ce urmaresc probleme diferite Pentru a realiza acest lucru, analiza cost-utilitate recurge la conceptul de utilitate, existand mai multe cai de obtinere a unei utilitati asociata fiecarei stari de sanatate Un asemenea artificiu are in vedere transformarea efectului masurat in utilitate Conform analizei cost-utilitate, nu se poate pune un semn de egalitate intre doua interventii care au costuri egale si care obtin aceleasi rezultate in termeni de ZFS (zile fara simptomatologie), daca intr-un caz ZFS se refera la recuperarea din depresie, iar in celalalt la recuperarea din arahnofobie (teama de paianjeni) inegalitatea in efecte se produce la nivel valoric, deoarece revenirea dintr-o stare depresiva are mai multe implicatii asupra functionarii eficiente la nivel psihic, social si profesional decat revenirea din arahnofobie Prin urmare, analiza cost-utilitate se raporteaza la eficienta, atat in termeni cantitativi (magnitudinea efectului, de exemplu, numarul de ZFS), cat si calitativi, prin valoarea atribuita recuperarii din starea respectiva (utilitatea fiind preferinta sau valoarea pe care o atribuie oamenii unei probleme de sanatate in functie de nivelul de afectare a calitatii vietii) Cel mai intalnit indicator utilizat intr-o analiza de tip cost-utilitate pentru a masura eficienta unei interventii este QALY (quality adjusted life years), acesta fiind o combinatie intre durata prelungirii vietii si calitatea acesteia in urma interventiei De exemplu, daca o interventie prelungeste viata unui pacient cu 4 ani, iar nivelul calitatii vietii pacientului aflat in conditia respectiva este egal cu 0,50, pe o scala de la 0 (o calitate a vietii atat de scazuta, incat moartea pare o alternativa la fel de dezirabila) la 1 (o calitate a vietii oferita de o stare de sanatate perfecta), indicele este 2 QALY (4 ani x 0,50) Din nefericire, desi analiza cost-utilitate este intalnita frecvent in domeniul clinic, ea este aproape absenta din alte domenii de interes ale psihologiei insa principiul din spatele QALY, acela de a combina castigul cantitativ (prelungirea vietii) cu cel calitativ (traind fericit), poate fi transpus in alte contexte De exemplu, o interventie in relatia de cuplu este interesanta nu numai daca salveaza relatia de la divort, ci si daca contribuie la cresterea satisfactiei maritale in mod similar, o interventie din domeniul organizational nu este interesanta doar pentru ca prelungeste perioada de angajare in cadrul aceleiasi firme, reducand fluctuatia, ci si ca angajatii ramasi sunt multumiti in cadrul firmei Motivul principal pentru care analizele de tip cost-utilitate au patruns in domeniul clinic, dar deocamdata nu si in alte domenii, deriva indeosebi din specificul si constrangerile financiare existente in sfera sanatatii Statul nu poate asigura subventionarea tuturor serviciilor de sanatate, iar pentru a lua rational decizii in aceasta directie, are nevoie de o unitate de masura comuna, care sa permita efectuarea de comparatii intre diferite programe, chiar daca efectul urmarit de acestea vizeaza o interventie in cancer sau rezolvarea cazurilor de arahnofobie De aceea, metodele dezvoltate pentru a atribui o utilitate efectului urmarit sunt impregnate de modelul medical, asa cum se poate vedea in continuare 6 3 1 Cum se ajunge la QALY? Analizand ideea din spatele acronimului QALY, putem vedea in acesta un produs dintre durata vietii (LY - life years) si ajustarea acestei durate in functie de calitatea vietii (QA - quality adjusted) LY din cadrul ecuatiei depinde de o serie de factori, dintre care cei mai importanti sunt: (a) tipul problemei avute in vedere (problemele de sanatate cu risc crescut sau scazut de deces); (b) intervalul temporar avut in vedere (problema acuta vs cronica) De exemplu, daca este vorba despre o interventie care isi pune amprenta asupra duratei vietii (o operatie de extirpare a unei tumori comparativ cu absenta interventiei sau cu o alta solutie propusa spre comparare), pot exista durate de timp diferite privind expectanta de viata, situatie in care ii revine un loc important componentei LY in calculul QALY in asemenea cazuri se aleg intervale mai lungi de timp pentru monitorizare, astfel incat diferentele la nivel de LY dintre interventii sa fie reflectate in QALY (deoarece LY se refera la numarul de ani traiti, indiferent de calitatea vietii din anii respectivi) in schimb, daca interventia vizeaza o problema care nu se reflecta in diferente semnificative cu privire la durata asteptata a vietii (de exemplu, o interventie menita sa reduca anxietatea sociala), adeseori sunt neglijabile diferentele in termeni de LY intr-un asemenea caz, accentul este pus pe surprinderea diferentelor in calitatea vietii produse de interventiile analizate Aceasta abordare este cunoscuta in literatura de specialitate ca HRQoL (Health Related Quality of Life) De asemenea, daca problema este una acuta, intervalul de timp de monitorizare poate fi unul scurt (preferabil cel putin an de zile), insa pentru problemele cronice se recomanda o monitorizare indelungata pentru calculul QALY Asadar, o decizie importanta in analiza cost-utilitate este alegerea intervalului temporar pentru care se calculeaza QALY, acesta putand varia de la un an sau chiar mai putin (in cazul unor probleme acute, cum ar fi episoadele depresive), pana la ani sau chiar zeci de ani (in cazul problemelor cronice, cum ar fi diabetul) in sfarsit, dat fiind ca unitatea minima de masura recomandata in cazul LY este un an de zile, efectuarea de analize cost-utilitate in contextul unei perioade mai scurte de monitorizare (de exemplu, sase luni) presupune apelul la asumptii, cum ar fi aceea ca rezultatele sunt stabile si pot fi extrapolate si la alte perioade de timp nemonitorizate in privinta celuilalt element component din QALY, QA (aspectele de calitate), acesta poate fi dedus prin metode multiple, inclusiv din datele despre eficienta colectate in cazul unor studii de tip cost-eficienta in pofida diferentelor de operationalizare dintre eficienta si utilitate, principiul este unul similar in spatele analizei cost-utilitate se porneste de la premisa unei legaturi puternice intre calitatea vietii unui individ si simptomatologia sa individul are o calitate a vietii din ce in ce mai scazuta pe masura ce simptomatologia problemei de care sufera acesta este mai severa De aceea, daca se cunoaste severitatea simptomatologiei unui individ se poate prezice nivelul calitatii vietii sale, implicit se poate acorda o valoare utilitatii starii sale de suferinta De exemplu, in studiul realizat de Sava et al (2009) au fost inclusi pacienti cu depresie majora, care la final au obtinut niveluri diferite de eficienta, de la mentinerea starii de depresie majora pana la recuperare completa in functie de gravitatea depresiei se poate acorda o anumita valoare a utilitatii, cuprinsa, de regula, intre 0 (decedat) si 1 (o calitate a vietii superioara ca urmare a unei stari de sanatate fizica si psihica perfecta) in literatura de specialitate se folosesc ponderi variabile pentru fiecare persoana ce sufera de depresie, de la 0,30 pentru cei cu depresie foarte severa pana la 0,90 pentru cei recuperati din depresie (Bennett, Torrance, Boyle, Guscott, 2000; Freed, Rohan, Yates, 2007; Lave et al , 1998; Revicki et al , 1995; Revicki, Wood, 1998) De exemplu, Freed et al (2007) utilizeaza la indivizii cuprinsi in studiu utilitati cuprinse intre 0,78 si 0,90 pentru scoruri BDi 1,96) Pentru alte detalii despre RCi sau alti indicatori similari, consultati Pintea (2010) Formula simpla de calcul a QALY raportata la un an de zile, fara discount temporal al costurilor (vezi Sassi, 2006 pentru alte variante complexe) Un alt concept standard intalnit mai rar in analiza cost-utilitate este reversul lui QALY, cunoscut sub acronimul DALY (disability adjusted life years) Acesta este produsul dintre utilitatea acordata problemei respective si costul unui an compus din zile cu simptomatologie in acest caz, interpretarea se inverseaza, valori egale cu 1 inseamna un an in conditii de dizabilitate, iar 0 inseamna absenta dizabilitatii (starea de sanatate perfecta) Numarul de zile alocat utilitatii din pretest decurge din faptul ca aceasta valoare contribuie pentru jumatate din perioada de urmarire dintre pretest si posttest (cu durata de 90 de zile) in mod similar, cele 135 arondate utilitatii din posttest reprezinta insumarea a jumatate din perioada dintre pre- si posttest (45 de zile) si a jumatate din perioada dintre posttest si finalul perioadei de urmarire (90 de zile din cele 180) Numarul de zile atribuite utilitatii de la finalul perioadei de urmarire reprezinta cealalta jumatate a perioadei dintre posttest si follow-up (90 de zile), dar si restul zilelor ramase din an, in absenta altor date empirice colectate, pornind de la premisa ca se mentine starea de sanatate observata la finalul perioadei de urmarire Daca ar fi existat un grup de control care sa nu primeasca o interventie activa, QALYG ar fi fost diferenta dintre QALY pentru grupul cu tratament activ si QALY pentru grupul de control pasiv (placebo, interventie uzuala) in studiul respectiv acest lucru nu a fost posibil deoarece toate cele trei grupe comparate vizau o interventie activa in practica pot exista cazuri de utilitati negative (mai mici decat zero), daca starea de sanatate indusa de tulburarea respectiva devine de nesuportat, fiind perceputa mai rea decat decesul Spre ilustrare, codul 23321 se refera la o stare de sanatate cu anumite probleme de mers (2); incapabil sa se autoingrijeasca singur (sa se spele sau sa se imbrace) (3); incapabil sa realizeze activitatile sale curente (de munca, studiu, timp liber) (3); cu dureri si disconfort moderat (2); si fara manifestari de anxietate sau depresie (1) in schimb, codul 12213 se refera la o stare de sanatate care: nu presupune niciun fel de probleme de mobilitate (1); intampina unele probleme de autoingrijire (referitoare la spalat sau imbracat de unul singur) (2); intampina unele probleme cu activitatile zilnice (munca, studiu, timp liber etc ) (2); nu implica durere sau disconfort fizic (1); este insotita de un nivel sever de anxietate sau depresie (3) Pentru fiecare dintre cele 5 dimensiuni sunt descrise trei stari de sanatate (functionare), 1 insemnand absenta problemelor, 2 - existenta anumitor probleme si 3 - existenta unor probleme grave in cazul utilizarii EQ-5D valorile utilitatilor variaza intre 1 (perfect sanatos) si -0,59, valoarea 0 insemnand deces Combinatia cea mai putin dorita (mai putin preferabila decat moartea) a inregistrat utilitatea de -0,59 Ea este, desigur, combinatia 33333, adica: incapabil sa mearga (consemnat la pat); incapabil sa aiba grija de el (nu se poate spala imbraca); incapabil de a derula activitatile sale anterioare zilnice (munca, familie, timp liber, studiu); cu dureri sau disconfort fizic intens; cu simptomatologie severa de anxietate sau depresie in acest caz al compararii a doua programe active, in locul raportului beneficii x 100 costuri se utilizeaza valoarea neta incrementala (iNPV - incremental net present value) iNPV = (beneficiu A -beneficiu B) - (cost A - cost B), valorile pozitive insemnand o superioritate a programului A, in timp ce un rezultat cu semn minus indica o preferinta pentru programul B Capitolul 7 Studiile metaanalitice 7 1 Scurt istoric si delimitari conceptuale Pana spre mijlocul anilor '80 ai secolului trecut, oamenii de stiinta se bazau exclusiv pe sinteze narative (calitative) atunci cand isi propuneau sa evalueze critic un set de studii ce vizau aceeasi problema De pilda, sintetizand studiile empirice din domeniul psihologiei cu privire la efectul filmelor violente asupra agresivitatii telespectatorilor, s-au obtinut rezultate contradictorii, unele studii identificand un efect semnificativ al mass-mediei in cresterea nivelului de agresivitate, altele obtinand efecte nule Pentru a rezolva o asemenea dilema, inainte de aparitia studiilor metaanalitice, solutia la indemana consta in realizarea unei evaluari calitative a studiilor (narrative review) Aceasta era facuta de catre un expert recunoscut in domeniu, pe baza studiilor identificate pe aceasta tematica Problema majora a acestui tip de abordare era faptul ca nu exista o metodologie obiectiva de apreciere a studiilor, criteriile de diferentiere dintre studii putand varia de la un cercetator la altul De pilda, un evaluator ar fi putut considera ca este nevoie de cel putin trei studii realizate de echipe de cercetare independente pentru a considera un efect ca fiind real, in timp ce un alt cercetator era multumit de rezultatele unui singur studiu pentru a indica existenta efectului, cu conditia ca acel studiu sa fi fost bine controlat, adica sa posede o validitate interna crescuta De asemenea, in urma revolutiei tehnologice ce a permis indexarea studiilor in baze de date internationale, procesul de evaluare calitativa a studiilor a devenit din ce in ce mai ineficient (intrucat solicita mari resurse de timp) si mai putin util (Borenstein, Hedges, Higgins si Rothstein, 2009) Explozia de informatii in toate domeniile de studiu este una extraordinara De exemplu, intr-un domeniu stiintific cum este cel al medicinei sunt publicate anual peste doua milioane de articole (apud Mulrow, 1994) Din aceste considerente, strategia a evoluat treptat dinspre o evaluare exclusiva de tip calitativ spre una de tip cantitativ in acest fel s-a facut trecerea de la evaluarile narative la evaluarile sistematice (systematic review sau research synthesis), ce presupun o metodologie riguroasa de lucru, in vederea diminuarii subiectivitatii din procesul de evaluare Green si McDonald (2005), respectiv Higgins si Green (2011) semnaleaza existenta unei neintelegeri din partea multor specialisti, aceea de a suprapune terminologic evaluarea sistematica si metaanaliza Aceasta perceptie eronata se bazeaza pe o situatie reala, deoarece majoritatea evaluarilor sistematice presupun utilizarea metaanalizei ca procedura statistica de lucru, in timp ce demersul metaanalitic presupune, la randul sau, o evaluare sistematica a literaturii de specialitate De aceea, relatia logica corecta dintre cele doua concepte este una de intersectie Acest lucru se intampla deoarece in anumite situatii pot fi realizate studii metaanalitice pe cateva cercetari disponibile, fara a exista in prealabil o evaluare sistematica a literaturii de specialitate sau in conditiile in care nu exista suficient de multe cercetari pentru a permite extragerea unor concluzii cu privire la problema investigata Pe de alta parte, desi multe evaluari sistematice se finalizeaza printr-o metaanaliza, exista situatii in care este nerecomandabil sa fie agregate date din domenii distincte Aceasta critica a fost adusa chiar de unul dintre cei mai mari psihologi ai tuturor timpurilor, Hans J Eysenck, care considera demersul metaanalitic ca fiind unul ce simplifica nepermis realitatea si care esueaza prin tendinta de a aduna merele cu perele (apud Field, 2005) Figura 7 1 Relatia conceptuala dintre evaluarea sistematica si metaanaliza Tabelul 7 1 Activitati specifice asociate conceptelor de evaluare sistematica si metaanaliza Evaluarea sistematica Metaanaliza Definire: Metodologia de lucru folosita pentru cautarea si selectarea studiilor relevante (incluse in metaanaliza), cu scopul de a reduce riscul de distorsiune a rezultatelor concluziilor Pasul 1 Formularea intrebarii de investigat si a criteriilor de includere a studiilor Pasul 2 Cautarea studiilor in bazele de date Pasul 3 Completarea bazei de date prin apelul la strategii alternative de cautare Pasul 4 identificarea studiilor eligibile (eliminarea studiilor neeligibile) Pasul 5 Realizarea bazei de date si completarea informatiilor necesare pentru derularea procedurilor metaanalitice Rezultat: O baza de date cu studii eligibile ce contin datele statistice necesare pentru a fi supuse metaanalizei Definire: Analiza statistica a datelor din studiile selectate prin procesul de evaluare sistematica, cu rolul de a creste nivelul de obiectivitate cu privire la rezultatele concluziile obtinute Pasul 1 Calcularea indicatorilor de marime a efectului pentru fiecare studiu eligibil Pasul 2 Selectarea tipului de metaanaliza si a algoritmilor de calcul Pasul 3 Calcularea indicatorilor metaanalitici tipici (de exemplu, media ponderata, intervalul de incredere al mediei, eterogenitatea etc ) Pasul 4 Analize statistice suplimentare (analize pe subgrupuri de studii, metaregresii) Pasul 5 Verificarea robustetii rezultatelor obtinute Rezultat: Un raspuns fundamentat statistic la intrebarea formulata la pasul 1 al evaluarii sistematice a literaturii de specialitate Desi delimitarea conceptuala mentionata mai sus este clara, se cuvine a fi precizat faptul ca rezultatele celor doua activitati sunt interdependente Astfel, fara metaanaliza sau in absenta unei metaanalize corect efectuate, demersul de evaluare sistematica isi pierde din insemnatate, prezentand neajunsuri similare cu cele mentionate in cazul evaluarilor narative , calitative Chiar in aceste conditii, evaluarile sistematice se disting de sintezele narative prin criteriile riguroase si transparente de selectie a studiilor intalnite intr-un demers sistematic De asemenea, realizarea unei metaanalize in absenta unui demers de evaluare sistematica prezinta un risc crescut de a conduce la rezultate distorsionate, deoarece numai anumite studii sunt luate in analiza De altfel, standardele APA de publicare a metaanalizelor (vezi capitolul 8) solicita, printre altele, o detaliere a modului in care au fost selectate articolele Fara dovada unei selectii riguroase si exhaustive a studiilor relevante pentru tematica investigata, metaanalizele nu au nicio sansa de a fi publicate in consecinta, a devenit o cutuma faptul de a combina cele doua aspecte intr-un demers unitar, astfel incat, atunci cand se vorbeste de demersuri metaanalitice, acestea sa fie fundamentate pe o evaluare sistematica prealabila, iar atunci cand se vorbeste de o evaluare sistematica a unui domeniu investigat, aceasta sa includa o procedura metaanalitica De aceea, pe parcursul acestui capitol vom dezvolta pasii necesari derularii unui studiu metaanalitic, pornind de la aceasta viziune a integrarii acestui demers intr-unul de evaluare sistematica a problemei investigate, chiar daca, din ratiuni pedagogice, s-a pastrat delimitarea dintre cele doua aspecte teoretice 7 2 Metodologia de evaluare sistematica Principii si aspecte aplicative 7 2 1 Formularea intrebarii de cercetare si a conditiilor de eligibilitate Confruntati cu numarul imens de publicatii in orice domeniu de studiu, prima conditie pentru eficientizarea cautarilor este sa definim foarte precis ceea ce urmeaza sa cautam Din perspectiva evaluarii sistematice, acest lucru inseamna deopotriva: (a) precizarea clara a intrebarii de investigat si (b) stabilirea criteriilor de eligibilitate pentru selectarea studiilor ce fac referire la problema cercetata Desigur, un asemenea demers ar trebui realizat doar dupa consultarea atenta a literaturii de specialitate, deoarece pot exista deja publicate metaanalize relevante pentru problematica investigata Demersul poate insa continua, chiar in cazul in care se identifica metaanalize relevante pentru problematica studiata, daca metaanalizele existente poseda o serie de limite importante din perspectiva intrebarii de investigat vizate (de exemplu, includ doar studii publicate pana in anul 2001 sau doar studii efectuate in SUA; pentru detalii vezi tabelul 7 2) 7 2 1 1 Formularea intrebarii de investigat in ceea ce priveste primul aspect, cel al precizarii intrebarii de investigat, o varianta utila ar fi utilizarea procedurii PiCO (Spring, 2007) ce urmareste specificarea clara a populatiei investigate (population), a interventiei evaluate (intervention), a metodei cu rol comparativ (comparison) si a efectului urmarit (outcome) Acest algoritm de formulare a intrebarii de investigat este deosebit de util mai ales in studiile metaanalitice de tip comparativ, in care marimea efectului nu este reprezentata de magnitudinea coeficientului de corelatie, ci de diferente intre medii sau cu privire la raportul sanselor observate Caseta 7 1 Formulari integrale sau partiale de tip PiCO pentru intrebari de investigat Compararea eficientei terapiei cognitiv-comportamentale (i) cu cea a terapiei sistemice (C) in reducerea nivelului de anxietate generalizata (O) la pacientii diagnosticati cu anxietate generalizata (P) Programele de socializare bazate pe traininguri outdoor (i) pot reduce comportamentul antisocial (O) al adolescentilor delincventi (P)* ** Psihoterapia sistemica (i) este la fel de eficienta ca si farmacoterapia (C) in reducerea ** simptomatologiei depresive (O) * Formulare in care lipseste elementul comparativ ** Formulare in care populatia nu este definita explicit Se observa ca cele mai bune formulari sunt cele mai tintite, in care sunt precizate toate cele patru elemente Daca prima dintre formulari defineste clar ceea ce este studiat, cea de-a doua nu precizeaza clar care este interventia cu care se compara eficienta trainingurilor outdoor in asemenea situatii, lucrurile se complica, iar raspunsul la intrebare devine unul dependent de criteriile suplimentare de eligibilitate specificate Astfel, exista posibilitatea de a obtine un anumit rezultat daca sunt selectate doar acele studii care fac referire la compararea eficientei trainingurilor outdoor cu cea a grupurilor de control (de exemplu, cu evolutia participantilor cuprinsi in listele de asteptare) in schimb, vom obtine un alt rezultat daca se compara eficienta trainingurilor outdoor fata de un grup mixt ce include ca element comparativ atat grupe de control de tipul listelor de asteptare, cat si grupe de control de tip placebo (interventii care nu sunt destinate reducerii comportamentului antisocial, dar care sunt promovate catre participanti ca metode de reducere a comportamentului antisocial) Din cel de-al treilea exemplu prezentat in caseta 7 1 lipseste populatia investigata Chiar daca acest lucru implica, aparent, doar o extindere a studiilor eligibile, decizia poate afecta semnificativ concluzia obtinuta De pilda, este posibil ca ambele categorii de interventii comparate, psihoterapia si farmacoterapia, sa fie la fel de eficiente la nivel general, insa aceasta egalitate sa ascunda in spatele ei niveluri diferite de eficienta pe categorii de varsta (psihoterapia fiind mai eficienta la adulti, iar farmacoterapia mai eficienta la copii si adolescenti) O alta problema sesizata cu referire la cel de-al treilea exemplu este caracterul foarte general al elementului comparativ (farmacoterapia), fara sa se distinga clar ce fel de tratament farmacoterapeutic se are in vedere (de exemplu, fluoxetina, imipramina etc ) in consecinta, ideal ar fi ca orice investigatie sistematica sa vizeze toate cele patru componente ale algoritmului PiCO, chiar daca le acorda ponderi diferite ca importanta, in timp ce interventiile si tratamentele comparative ar trebui sa fie precizate cel putin la un nivel mediu de specificitate, evitandu-se concepte-umbrela prea largi, cu un nivel ridicat de generalitate, precum farmacoterapia sau psihoterapia in ceea ce priveste problemele de tip corelational investigate, acestea ar trebui sa aiba in vedere cel putin cele doua variabile investigate (de exemplu, "asocierea dintre abilitatile cognitive generale si performanta la locul de munca"; "relatia dintre personalitate si absenteism"), dar includerea populatiei la care se face referire ar constitui un atu cu valente aplicative ridicate De pilda, relatia dintre personalitate si absenteism ar putea avea caracteristici diferite daca se are in vedere populatia scolara (puberi, adolescenti) sau populatia activa (adulti angajati), pornind de la simplul fapt ca absentele scolare, intre anumite limite, se soldeaza cu consecinte institutionale diferite comparativ cu absentele de la locul de munca De multe ori insa, asemenea caracteristici ale studiilor, precum populatia investigata, metoda de cercetare utilizata etc , nu sunt definite drept criterii de includere, ci sunt analizate ca variabile moderatoare pentru a vedea in ce contexte specifice relatia dintre variabilele de interes (de exemplu, dintre personalitate si absenteism) este una mai intensa De asemenea, pot fi realizate metaanalize care sa cuprinda relatia dintre trei sau mai multe variabile de interes cum este situatia surprinderii unor efecte de mediere (de exemplu, sa studiem daca nivelul de epuizare emotionala [burnout] mediaza relatia dintre neuroticism ca trasatura de personalitate si absenteism) 7 2 1 2 Stabilirea criteriilor de eligibilitate pentru includerea studiilor in evaluare Dupa stabilirea clara a problemei supuse evaluarii sistematice, este nevoie sa se stabileasca o serie de criterii de includere (excludere) a studiilor ce abordeaza aceeasi tema Din acest punct de vedere, metodologia de evaluare sistematica a literaturii de specialitate este una riguroasa, specificata explicit in articolele de acest gen, astfel incat sa fie clara cititorilor si sa permita replicarea rezultatelor Desigur, criteriile de eligibilitate pot urmari o serie de parametri ai studiilor, cum ar fi designul cercetarii, tipologia participantilor, modalitatile acceptate de operationalizare ale constructelor evaluate, data si limba publicarii studiilor, tipul de studii etc Cu cat sunt controlati mai multi parametri, cu atat vor rezulta mai putine studii eligibile in final Studiile selectate vor fi doar cele care respecta in totalitate conditiile dorite de cercetator in general, evaluarile sistematice care vizeaza doar identificarea unei asocieri intre variabile (de exemplu, legatura dintre constiinciozitate si comportamentele contraproductive) aleg filtre mai putin dure in selectarea studiilor, deoarece obiectivul vizat de metaanaliza este doar unul de tip descriptiv-analitic, de a identifica existenta unei corelatii dintre cele doua constructe luand in calcul ansamblul studiilor ce contin o asemenea analiza in schimb, evaluarile sistematice care isi propun obiective de tip cauzal sau explicativ utilizeaza criterii foarte dure in alegerea studiilor de analizat in aceste conditii, cercetatorul poate impune criterii dure de selectie a studiilor, care sa permita doar includerea studiilor experimentale, eliminand alte tipuri de studii, considerate problematice din perspectiva validitatii interne a unei concluzii de tip cauza-efect, precum este cazul studiilor non-experimentale in plus, studiile metaanalitice orientate spre surprinderea unei relatii cauzale pot lua in considerare doar anumite tipuri de experimente, in functie de tipul grupului comparat (de exemplu, eliminand acele studii in care grupul de control comparat nu a primit niciun fel de interventie) in tabelul 7 2 sunt prezentate principalele criterii de eligibilitate utilizate in selectarea studiilor Ele sunt insotite de doua cazuri ilustrative, adaptate din literatura de specialitate, cu referire atat la metaanaliza bazata pe comparatii intre medii (Lipsey si Wilson, 2001), cat si la o metaanaliza a corelatiilor (McDaniel, 2005) Exemplele au fost modificate in scop pedagogic pentru a reflecta cat mai precis specificul diferitelor filtre Tabelul 7 2 ilustrarea transpunerii criteriilor de eligibilitate in evaluarea sistematica Obiectivul evaluarii sistematice Exemplul 1 Stabilirea eficientei programelor outdoor in reducerea comportamentelor antisociale la adolescentii delincventi (obiectiv cauzal) Care sunt caracteristicile celor mai eficiente, respectiv ale celor mai putin eficiente programe (obiectiv descriptiv-analitic)? Exemplul 2 Stabilirea existentei unei asocieri intre nivelul de inteligenta si volumul creierului (obiectiv descriptiv-analitic) Criterii de eligibilitate: definirea acceptabila a constructelor; tipul de studii; tipul de participanti; contextul cultural; data publicarii; limba publicarii; alte filtre relevante Definirea si operationalizarea acceptabila Exemplul 1 Studiile eligibile trebuie sa contina cel putin o a constructelor interventie care sa se incadreze ca training outdoor cu scopul de a reduce comportamentul antisocial al Scopul acestui filtru: participantilor Prin aceasta se intelege orice program ce precizarea aspectelor definitorii pe care implica invatare experientiala ca urmare a derularii unor trebuie sa le posede constructele evaluate si activitati ce cuprind atat dimensiunea de provocare a modalitatilor acceptate de operationalizare fizica aventura (de exemplu, escaladarea stancilor, ale acestora CE EVALUaM? (validitate de construct) deplasarea cu tiroliana etc ), cat si dimensiunea sociala (interactiuni cu colegii, munca in echipa, comportament prosocial) Programele de tip recreational (jocuri de fotbal, tenis de masa etc ) nu sunt eligibile pentru a fi incluse, deoarece le lipseste dimensiunea de provocare fizica Sunt, de asemenea, excluse studiile ce fac referire la programe de training outdoor care, desi includ cele doua componente vizate, au fost concepute in alte scopuri (de exemplu, pentru a imbunatati stima de sine sau abilitatile de munca in echipa etc ) Studiile incluse trebuie sa cuprinda cel putin o masura valida a comportamentului antisocial printre variabilele dependente evaluate Masura trebuie sa fie una comportamentala (de exemplu, o grila de observatii), nu una bazata pe raspunsuri de tip autoraportat (self-report) Variabila dependenta trebuie sa faca referire directa la constructul evaluat (comportament antisocial), nefiind eligibile studiile ce vizeaza constructe conexe (controlul maniei etc ) Exemplul 2 Studiile eligibile trebuie sa includa masuratori ale ambelor constructe analizate (inteligenta, respectiv volumul creierului) in literatura de specialitate sunt intalnite doua modalitati de masurare a volumului creierului: (a) masurarea externa a circumferintei craniului; (b) masurarea interna, in vivo, a volumului creierului prin scanarea de tip RMN (imagistica cu rezonanta magnetica) Deoarece primul tip de masuratori duce doar la o estimare a volumului creierului, vom considera eligibile pentru a fi analizate doar studiile care utilizeaza scanarea RMN ca modalitate de masurare in vivo a volumului creierului De asemenea, vom include doar studiile care fac referire la masurarea integrala a volumului creierului si vom exclude studiile care evalueaza doar portiuni ale volumului acestuia, cum ar fi evaluarea in vivo prin MRi a volumului de materie cenusie frontala in privinta inteligentei, vom urmari masurarea inteligentei fluide, aceasta fiind componenta cu cel mai mare substrat biologic, deoarece este independenta de contextul cultural Tipul de studii acceptate Exemplul 1 Studiile luate in analiza trebuie sa includa un grup comparativ Loturile de control acceptate pot fi: tratament obisnuit (treatment as usual), interventiile de tip placebo, listele de asteptare sau absenta tratamentului Elementul-cheie identificabil in grupul comparativ (de control) este absenta efortului de a produce o schimbare in directia urmarita (reducerea comportamentului antisocial) Vor fi acceptate doar studiile experimentale (implica randomizarea participantilor in grupele comparate) si cele participantilor in grupe), cu conditia ca pentru cele din urma sa existe evaluari la nivel de pretest (inaintea derularii interventiei) care sa indice ca loturile comparate Scopul acestui filtru: selectarea acelor studii care pot raspunde la intrebarile metaanalizei (de exemplu, a studiilor experimentale pentru obiective de tip cauzal) Prin acest criteriu se poate exercita un control asupra variabilelor straine ce pot afecta concluziile obtinute Controlul se face prin selectarea exclusiva a cvasiexperimentale (formate fara randomizarea studiilor care au un nivel ridicat de validitate interna, daca obiectivul metaanalizei este unul pretentios (de exemplu, demonstrarea unei relatii cauzale) nu difera nici la nivelul comportamentului antisocial, nici la nivelul altor variabile asociate acestuia (care reprezinta factori de risc), cum ar fi istoricul delincventei, varsta, genul participantilor etc Studiile de tip pretest-posttest nu sunt eligibile in absenta unui grup de control De asemenea, nu sunt eligibile nici studiile de tip non-experimental Exemplul 2 Fiind vorba de un obiectiv de tip descriptiv-analitic, este acceptat orice tip de studiu corelational care include masuratori ale celor doua variabile, cu conditia respectarii conditiilor precizate la primul criteriu-filtru Totusi, deoarece o parte dintre probele utilizate pentru surprinderea nivelului de inteligenta nu reprezinta CE STUDii ACCEPTaM PENTRU A RaSPUNDE LA iNTREBAREA (OBiECTiVUL) CERCETaRii? (validitate interna) indicatori puri ai conceptului de inteligenta fluida (de exemplu, WAiS), iar altele au o validitate de construct limitata (fiind putin raspandite necunoscute), s-a optat pentru selectarea exclusiva a studiilor care utilizeaza ca masura a inteligentei fluide o varianta a matricilor Raven, acesta fiind instrumentul standard de evaluare a inteligentei fluide Tipul de participanti inclusi Exemplul 1 Sunt eligibile studiile realizate pe adolescenti delincventi (studii in care participantii au varste cuprinse Scopul acestui filtru: intre 12 si 21 de ani), indiferent de tipul infractiunii comise operationalizarea (specificarea clara a participantilor la care se rezuma evaluarea sistematica) si de prezenta sau absenta vreunei tulburari precizate in DSM la adolescentii inclusi in analiza (focalizarea fiind pe adolescentii delincventi, in general) Exemplul 2 Sunt eligibili toti participantii, indiferent de CARE ESTE GRUPUL-tiNTa? (validitate externa) varsta sau sex, cu conditia sa fie vorba despre loturi neclinice, adica de participanti care sa nu fie diagnosticati cu vreo boala tulburare neuropsihologica, genetica sau psihiatrica ce poate afecta datele colectate (de exemplu, capacitatea participantilor de a completa testul de inteligenta, prezenta unor cazuri de hidrocefalie, sindrom Down etc ) Contextul cultural Exemplul 1 Deoarece conceptul de comportament antisocial este dependent cultural (cultura chineza, cultura Scopul acestui filtru: din tarile islamice etc pot avea viziuni diferite asupra specificarea clara a gradului de generalizare a rezultatelor masurilor de actiune potrivite in cazul comportamentelor antisociale), vom include in analiza doar acele studii care s-au derulat in culturi din spatiul nord-american (SUA si CARE ESTE GENERALiZABiLiTATEA Canada) REZULTATELOR? (validitate externa) Exemplul 2 Sunt incluse in analiza toate studiile care respecta criteriile mai sus amintite, indiferent de spatiul cultural in care au fost colectate datele Data publicarii Exemplul 1 in analiza au fost incluse doar studii publicate dupa 1980 inainte de aceasta data, conceptul de Scopul acestui filtru: comportament antisocial avea o alta definire, diferita de reprezinta un filtru optional, care poate fi activat atunci cand exista un motiv care ar justifica o restrangere a perioadei de cea actuala Pentru a evita distorsiunile legate de ambiguitatile (diferentele) in definirea efectului studiat (reducerea comportamentului antisocial), am luat in analiza cautare, cum ar fi focalizarea pe studii aparute ulterior unei metaanalize realizate, modificari in operationalizarea unor variabile etc CARE ESTE PERiOADA DE RAPORTARE? (validitate externa si de construct) Limba publicarii Scopul acestui filtru: este un filtru optional: barierele lingvistice doar studiile efectuate dupa 1980, care reflecta conceptul actual de comportament antisocial Exemplul 2 Nu exista un filtru temporal pentru includerea studiilor selectate in aceasta evaluare sistematica Studiile selectate iau in calcul atat cercetarile incluse in analiza precedenta realizata de "Popescu" et al (2003), cat si studiile mai recente, ce nu au fost incluse in metaanaliza anterioara, marind astfel cu 70% numarul de studii cuprinse in analiza Exemplul 1 in analiza vor fi incluse doar studiile publicate in limba engleza Exemplul 2 in analiza vor fi incluse studii publicate in una din urmatoarele limbi de circulatie internationala: engleza, pot afecta calitatea unei evaluari sistematice, mai ales atunci cand nu exista spaniola si germana, pentru care exista expertiza necesara de evaluare a articolelor eligibile Pentru a elimina explicatie logica pentru o asemenea optiune problematica lingvistica din aceasta analiza, vom utiliza (vezi exemplul 2) algoritmul de calcul de tip N sigur (fail-safe N) pentru a CE STUDii SUNT ANALiZATE? (validitatea externa) identifica numarul suplimentar de studii care ar putea modifica rezultatul obtinut si il vom raporta la numarul de studii eligibile, dar excluse din analiza din motive lingvistice (absenta posibilitatii de a evalua critic articolele scrise intr-o limba straina necunoscuta) o Alte filtre relevante Tipul publicatiei intr-o evaluare sistematica pot fi cuprinse si alte tipuri de studii decat cele publicate in reviste de specialitate De exemplu, decizia de a restrange cautarile doar la nivelul studiilor publicate in reviste de specialitate poate distorsiona efectul gasit prin faptul ca in reviste au mai mari sanse sa patrunda studiile cu rezultate semnificative statistic decat cele cu efecte nesemnificative statistic De aceea, includerea rapoartelor tehnice, a prezentarilor de la conferinte, a unor manuscrise nepublicate, a unor capitole de carti etc ar oferi o viziune de ansamblu mai apropiata de realitate decat fundamentarea algoritmului de lucru doar pe baza studiilor publicate Desigur, o asemenea decizie nu ar trebui sa faca rabat de la celelalte criterii mentionate, astfel incat ar fi indicat sa ne asiguram ca studiile de acest gen sunt adecvat realizate din punct de vedere metodologic, alte cauze decat calitatea lor fiind cele pentru care ele nu au ajuns sa fie publicate in reviste de specialitate O solutie propusa de Clark-Carter (2010) ar fi efectuarea de analize distincte in situatiile in care studiile provenite din zona gri a literaturii de specialitate (rapoarte, prezentari la conferinte etc ) sunt incluse, respectiv excluse Aceasta analiza a sensibilitatii rezultatelor poate reflecta robustetea scorurilor (in cazul in care se obtin rezultate similare), respectiv poate evidentia fragilitatea concluziilor obtinute, in functie de decizia de a extinde sau nu analiza dincolo de sfera studiilor publicate in reviste de specialitate Datele disponibile Unele studii, desi eligibile din perspectiva criteriilor propuse, sunt eliminate ulterior din analize, din cauza faptului ca nu contin date suficiente pentru a identifica marimea efectului studiat De asemenea, alte studii pot prezenta informatii insuficient detaliate pentru a aprecia daca sunt sau nu indeplinite criteriile de eligibilitate, fapt care conduce la eliminarea lor din analiza, din motive de prudenta, mai cu seama daca informatiile care lipsesc creeaza dificultati in aprecierea gradului de indeplinire a primelor doua filtre mentionate in acest tabel 7 2 2 Cautarea studiilor eligibile in bazele de date existente Dupa stabilirea clara a intrebarii de investigat (obiectivului urmarit) si dupa precizarea clara a criteriilor de eligibilitate a studiilor, se poate trece la pasul 2: cautarea studiilor relevante pentru problematica studiata O simpla cautare folosind mijloace informatice uzuale (de exemplu, motorul de cautare Google) va da, probabil, sute sau mii de rezultate, indiferent de subiectul abordat Pe langa riscul obtinerii unui esantion distorsionat si nereprezentativ de studii, este posibil sa pierdem mult timp cu identificarea studiilor relevante Din fericire, exista alte mijloace mai potrivite de a derula aceste cautari in primul rand se consulta bazele de date specializate pentru domeniului studiat De pilda, in domeniul psihologiei, principala baza de date ce contine informatii privind studiile derulate este PsyciNFO (APA, 2011) Aceasta baza de date contine peste 3 000 000 de intrari, dintre care 1 000 000 provin din ultimii sase ani, acoperind atat articole publicate in reviste de specialitate, cat si capitole de carti, carti, rapoarte tehnice si disertatii Desi majoritatea inregistrarilor se rezuma la spatiul anglo-saxon, articolele indexate sub forma de rezumate provin din reviste de specialitate publicate in peste 50 de tari Dezavantajul major al acestei baze de date este ca inregistreaza documentele doar sub forma de rezumate Accesul la versiunea completa a acestor documente se poate face insa prin intermediul altor baze de date specializate precum PsycARTiCLES (Asociatia Psihologilor Americani, APA), Academic Search Complete Premier (EBSCO), ProQuest Central (ProQuest), Ovid, ScienceDirect etc Caseta 7 2 Alte baze de date conexe domeniului psihologiei in domeniul clinic (inclusiv psihoterapie) Medline (PubMed) Medline constituie cea mai prestigioasa baza de date din domeniul stiintelor medicale PubMed este serviciul disponibil gratuit online ce indexeaza 5 400 de reviste din 80 de tari, inclusiv Medline Din pacate insa, cele mai multe inregistrari sunt disponibile doar sub forma de rezumate EMBASE Este, probabil, cea mai extinsa baza de date din domeniul medical, incluzand, pe langa inregistrarile complete din Medline, alte 2 000 de reviste de specialitate neincluse in Medline, totalizand peste 24 de milioane de intrari (7 000 de reviste), la care se adauga, din 2009, anual, rezumatele de la peste 800 de conferinte in schimb, are dezavantajul de a fi disponibila contra cost in domeniul educational ERiC Aceasta este principala baza de date din sfera stiintelor educatiei, ea incluzand articole din reviste de specialitate (aproximativ 1 200 de reviste), comunicari la conferinte, carti, precum si rapoarte tehnice din domeniul educatiei O parte din inregistrari este disponibila ca text integral, insa cele mai multe inregistrari se regasesc sub forma de rezumat in domeniul organizational EconLit Aceasta este principala baza de date din domeniul stiintelor economice, inclusiv din sfera managementului resurselor umane, cu peste un milion de inregistrari interdisciplinare Dissertation Abstracts Online lnternational Aceasta baza de date speciala include aproape toate tezele de doctorat sustinute in SUA, precum si o selectie a tezelor de doctorat din Canada si Marea Britanie Din 1988 sunt incluse si unele disertatii de la nivel de master din SUA Un numar considerabil de teze sunt disponibile in varianta cu text integral, nu doar sub forma de rezumate Scopus (SciVerse Scopus) Aceasta baza de date combina indexarea sub forma de rezumate a literaturii de specialitate provenind din peste 16 500 de reviste din diverse domenii de studiu, dar si a literaturii stiintifice identificate online prin motorul de cautare Scirus Scopus este de asemenea, o baza de date utila pentru a identifica citarile ulterioare ale articolelor relevante pentru tema investigata iSi Web of Science Este cea mai prestigioasa baza de date internationala, reunind inregistrari din toate domeniile stiintifice, indeosebi din revistele (articole, sinteze) sau conferintele (proceedings) cele mai importante din fiecare domeniu de studiu Rolul acestei baze de date este insa in primul rand unul de inregistrare a citarilor primite de fiecare articol inclus in baza de date Orice demers de cautare de studii in vederea realizarii unei metaanalize ar trebui sa porneasca de la ideea cautarii acestor studii in cel putin doua baze de date independente Pentru domeniul psihologiei, printre acestea obligatoriu ar trebui sa se regaseasca PsyciNFO De exemplu, studiile metaanalitice din zona interventiilor psihoterapeutice validate stiintific pentru tulburarea de depresie majora ar putea lua in considerare trei baze de date relevante: PsyciNFO, EMBASE si Dissertation Abstracts, primele doua datorita temei analizate din sfera clinica, iar ultima pentru a include acele teze de doctorat disertatii ce nu se regasesc in cele doua baze de date principale 7 2 2 1 Reguli de cautare a inregistrarilor relevante pentru studiul metaanalitic Pentru cautarea studiilor in baze de date relevante pentru tematica studiata pot fi enumerati cativa algoritmi de lucru, cu scopul de a maximiza sansele de includere a cat mai multor studii relevante Toti algoritmii urmaresc cresterea sensibilitatii cautarii in dauna specificitatii in cazul studiilor selectate Cu alte cuvinte, se prefera mai degraba includerea unui numar cat mai mare de studii, inclusiv a unora care se dovedesc ulterior irelevante (situatii fals pozitive), decat includerea unui numar mai redus de studii, masura asociata unui risc ridicat de a exclude o serie de studii relevante 1 Utilizati cuvinte-cheie incluse in tezaurul de cuvinte disponibil intr-o baza de date Orice baza de date contine un tezaur de expresii (thesaurus), stabilite de catre specialisti, ce poate fi consultat De pilda, cunoscutul model Big Five de personalitate este precizat in tezaurul de cuvinte din PsyciNFO in categoria "Five-factor model of personality" Utilizarea cuvintelor incluse in tezaur mareste sansa de a identifica mai multe articole relevante, deoarece includerea lor in tezaur s-a facut la propunerea specialistilor pe baza frecventei lor de aparitie in calitate de cuvinte-cheie in articole si a relevantei lor conceptuale 2 Utilizati cuvinte-cheie aflate in relatii categoriale cu conceptele-cheie studiate Bunaoara, daca cineva este interesat sa studieze relatia dintre modelul de personalitate in cinci factori si absenteismul de la locul de munca, cautarea nu trebuie sa se rezume doar la acest nivel categorial de analiza De exemplu, cautarea se poate extinde folosind cuvinte-cheie dintr-o categorie superioara ca nivel de abstractizare, cum ar fi personalitatea in mod similar, in cazul absenteismului am putea utiliza conceptul de devianta de la locul de munca (workplace deviance) O asemenea strategie merita utilizata, pentru ca intotdeauna vor exista studii cu niveluri diferite de generalitate (de exemplu, un studiu in care absenteismul este numai una dintre variabilele incluse in analiza poate fi parte a unui studiu extins cu privire la relatia dintre personalitate si comportamentul deviant la locul de munca) in mod similar, vor exista si studii care se vor rezuma la un nivel ingust de analiza Un astfel de caz ar fi situatia in care studiul ar viza doar legatura dintre constiinciozitate si absenteism, fara a viza toate dimensiunile modelului in cinci factori ai personalitatii Deoarece trasatura constiinciozitatii este una dintre cele cinci dimensiuni ale modelului, rezultatele din asemenea studii ar fi utile pentru evaluarea relatiei dintre dimensiunea respectiva si absenteism 3 Combinati cautarile folosind operatori logici extensivi (X sau Y) Pentru a maximiza probabilitatea de a cuprinde cat mai multe articole relevante pentru topica urmarita se pot utiliza cuvinte-cheie multiple, conectate prin operatorul logic de tipul "sau" Spre ilustrare, in cazul tematicii amintite mai sus am putea utiliza o cautare care sa permita includerea oricarui studiu in analiza care contine oricare dintre urmatoarele trei cuvinte-cheie: "personality" or "five-factor personality model" or "Big Five" 4 Utilizati simbolurile speciale in cautare Multe baze de date, inclusiv PsyciNFO, permit utilizarea unor simboluri speciale precum asteriscul (*) pentru a include toate cuvintele apropiate ca formulare lingvistica Astfel, spre exemplu, utilizarea sintagmei "absen*" va permite identificarea articolelor care au utilizat cuvinte precum "absent", "absence", "absenteeism", "absentee" etc , adica a acelor cuvinte care au aceeasi radacina cu formularea ce preceda asteriscul 5 Faceti apel la metacautari folosindu-va de istoricul cautarilor Pentru a maximiza sansele cautarii de articole relevante pentru tematica studiata nu este indicat ca procesul sa fie finalizat intr-unul sau doi pasi, ci ar fi preferabil ca aceasta cautare sa se realizeze in pasi multipli, precum cel rezumat in caseta urmatoare, cu privire la relatia dintre modelul celor cinci factori de personalitate si absenteismul la locul de munca Astfel, primii trei pasi descrisi au rolul de a extinde pe cat posibil aria de cuprindere a studiilor ce implica personalitatea (inclusiv, spre exemplu, modelul cu trei factori ce contine extravertirea si neuroticismul ca dimensiuni comune cu cele din modelul Big Five) Pasul 4 are, de asemenea, un rol extensiv, acela de a selecta acele studii care contin cuvinte-cheie cu radacina specificata (de exemplu, "absence", "absenteeism", "deviant behavior", "deviance" etc ) Rolul ultimilor doi pasi este unul de restrangere a studiilor pentru a limita cautarile Astfel, pasul 5 indica faptul ca vor fi retinute doar studiile care intersecteaza (reunesc) atat caracteristicile specificate in pasul 3, cat si pe cele specificate in pasul 4 in sfarsit, ultimul pas restrange aria de selectie a studiilor, pastrandu-le doar pe acelea care nu se refera la absenteismul scolar, fiind excluse studiile in care apare cuvantul-cheie "school" Un aspect complementar, dar important de retinut, se refera la termenii de referinta cautati Astfel, desi in exemplul prezentat s-a precizat peste tot ca ar fi vorba despre termeni cautati in calitate de cuvinte-cheie, termenii pot viza si alte specificatii, cum ar fi faptul de a fi cuprinsi in titlu sau chiar in rezumatul inregistrarii facute Desigur, cautarea termenilor la nivelul rezumatelor va conduce la o crestere semnificativa a studiilor care contin termenii respectivi comparativ cu includerea acestora doar in categoria cuvintelor-cheie De asemenea, utilizarea operatorilor logici extensivi ("sau") conduce la extinderea ariei de studii selectate, in timp ce utilizarea operatorilor logici intensivi ("si") conduce la restrangerea studiilor selectate Caseta 7 3 Pasi in cautarea de studii relevante pentru relatia dintre personalitate si absenteism la locul de munca Pasul 1 (92548) SU personality or SU five-factor model of personality or Ti big five or Ti big three Pasul 2 (12947) SU extraversion or SU conscientiousness or SU agreeableness or SU neurotic* or SU emotional stability or SU openness* Pasul 3 (102029) Pasul 1 or Pasul 2 Pasul 4 (4562) Ti absen* or Ti devian* or Ti attendance Pasul 5 (213) Pasul 3 and Pasul 4 Pasul 6 (188) Pasul 5 not AB school Observatie! Valorile dintre paranteze reprezinta numarul de inregistrari (articole, capitole de carte etc ) gasite la momentul cautarii in baza de date PsyciNFO care corespund criteriului specificat Formularile de tip SU, Ti, AB pot fi specificate de la inceput sau se poate opta pentru scrierea directa a termenilor cautati, cu conditia selectarii din meniu a nivelului de analiza (titlu, cuvinte-cheie etc ) Am luat in considerare numai inregistrari care au trecut prin procesul de evaluare colegiala in caseta 7 3 se observa ca, pentru unii termeni, cautarea s-a realizat la nivelul cuvintelor-cheie (SU), pentru altii cautarea s-a facut la nivelul cuvintelor din titlu (Ti), iar in cazul ultimului pas au fost eliminate din analiza studiile care contineau cuvantul "school" in rezumat (AB) in final au fost identificate 188 de inregistrari ce corespund ultimului pas efectuat, ceea ce inseamna ca au fost eliminate 25 de studii fata de pasul anterior, deoarece acestea contineau in rezumatul lor termenul "school", considerat irelevant pentru absenteismul la locul de munca (al angajatilor) 7 2 3 Strategii alternative de cautare a informatiilor relevante Chiar daca apelul la bazele de date internationale este strategia de baza utilizata pentru a identifica studii relevante pentru tematica supusa evaluarii sistematice, exista, din mai multe motive, un risc crescut de a nu gasi toate documentele relevante Un motiv ar fi acela ca unele publicatii nu ajung sa fie indexate in vreo baza de date, iar altele pot fi indexate in alte baze de date decat cele utilizate in procesul de cautare Apoi, unele rezultate stiintifice nu ajung sa fie promovate prin articole, putand ramane sub forma unor rapoarte de cercetare recomandari de politici publice, realizate pentru a informa vreo agentie publica sau vreo organizatie privata, care adeseori este si finantatorul sau beneficiarul proiectului respectiv Aceste studii fac parte din ceea ce se numeste literatura gri (grey literature) (Hopewell, Clarke si Mallett, 2005, apud Clark-Carter, 2010) Un alt motiv pentru care unele studii relevante pentru tematica studiata nu ajung sa fie identificate consta in lipsa de experienta a cercetatorului de a alege cei mai potriviti termeni pentru a fi introdusi in analiza datelor Un exemplu ar fi utilizarea exclusiva a termenului din limba engleza "absenteeism", pentru a fi cautat in titlul inregistrarilor, spre deosebire de utilizarea criteriului mai larg de a cauta orice cuvant din titlu care incepe cu "absen*", sau chiar a unor concepte conexe precum "workplace deviance" (vezi pasul 4 din caseta 7 3); faptul ar conduce la neselectarea unor articole potential relevante doar pentru faptul ca in titlul lor autorii au folosit alte exprimari decat "absenteeism" De aceea, pentru a reduce numarul de studii relevante care nu au fost selectate dupa cautarea in bazele de date internationale cu ajutorul unor termeni-cheie se poate apela la o serie de strategii complementare, precum cele prezentate in continuare 7 2 3 1 identificarea unor studii din sintezele teoretice (metaanalizele) anterioare Unele studii care au scapat selectiei initiale, in urma consultarii bazelor de date internationale, pot fi identificate ca fiind relevante prin consultarea evaluarilor sistematice de tip narativ sau a metaanalizelor realizate pe tematica studiata, in cazul in care asemenea publicatii exista in acest caz, se recurge atat la un demers focalizat (identificand sinteze teoretice sau metaanalize tintite pentru tematica urmarita, cum ar fi relatia dintre trasaturile de personalitate dupa modelul celor cinci factori mari si absenteismul de la locul de munca), cat si la un demers extins la tematici apropiate (sinteze teoretice sau metaanalize pe teme conexe, cum ar fi predictorii psihologici ai comportamentului deviant la locul de munca) Printr-o asemenea strategie este posibil sa identificam alte studii relevante, datorita faptului ca studiile respective erau indexate pe baza altor termeni-cheie decat cei folositi in algoritmul de cautare 7 2 3 2 identificarea unor referinte bibliografice secundare publicate anterior Nu numai sintezele narative metaanalizele anterioare sunt utile pentru a identifica studii relevante Este foarte posibil ca in urma studiului inregistrarilor relevante identificate cu ajutorul bazelor de date utilizate sa gasim in textul articolelor trimiteri catre referinte bibliografice relevante, dar care nu au fost incluse intre articolele selectate in prima faza 7 2 3 3 identificarea unor referinte bibliografice secundare publicate ulterior Tehnologia din ziua de astazi, precum si specificul unor baze de date internationale, indeosebi iSi Web of Science sau Scopus, permit identificarea unor studii ulterioare publicatiei analizate: unele dintre acestea pot fi relevante De pilda, bazele de date amintite pot identifica toate studiile aparute (indexate) ulterior, care citeaza articole identificate ca relevante Astfel, daca din consultarea bibliografiei unui articol putem afla doar studiile similare antecedente care au stat la baza articolului respectiv, cautarea citarilor existente pentru un anumit articol permite identificarea studiilor descendente, care abordeaza o tematica similara cu cea a articolului evaluat 7 2 3 4 Strategii de cautare a literaturii gri Strategiile mentionate anterior au in vedere doar publicatiile care, dintr-un motiv sau altul, au scapat identificarii initiale cu ajutorul bazei de date Pentru a identifica cercetarile nefinalizate printr-un studiu (conferinta) indexat in bazele de date internationale, se poate discuta cu specialistii din domeniu sau se poate apela la contactarea directa a organizatiilor relevante din domeniu De exemplu, pentru a investiga relatia dintre plecarea parintilor la munca in strainatate si reusita scolara a elevilor, ar fi util sa contactam organizatii publice sau neguvernamentale, precum Directiile Judetene de Asistenta Sociala si Protectia Copilului, "Salvati Copiii" etc , care ar putea detine studii relevante, dar nefinalizate prin publicatii in reviste indexate in bazele de date internationale 7 2 3 5 Strategii de cautare bazate pe chestionarea specialistilor O alta metoda utila de cautare a unor studii suplimentare celor identificate in bazele de date internationale este aceea de a trimite specialistilor interesati de tematica studiata o lista cu studiile identificate, cu rugamintea de a verifica daca sunt si alte publicatii relevante ramase in afara listei in caseta 7 4 este ilustrata implementarea acestei strategii in cazul unui studiu metaanalitic efectuat de McDaniel (2005) ce viza relatia dintre inteligenta generala si volumul creierului Caseta 7 4 ilustrarea demersului de identificare a studiilor relevante prin apelul la specialisti Studiile relevante identificate prin apelul la baze de date internationale au fost centralizate si trimise la peste 50 de specialisti din domeniu, fiind contactati: (a) cei care au publicat anterior studii privind relatia dintre inteligenta si volumul creierului; (b) cei care au facut comentarii si analize critice pe acest subiect; (c) cei despre care se cunostea faptul ca erau interesati de acest subiect Toti acestia au fost rugati sa specifice eventualele studii relevante omise din lista trimisa, respectiv daca au informatii despre eventuale rezultate nepublicate pe aceasta tema 7 2 4 identificarea studiilor eligibile pentru demersul metaanalitic Rezultatul implementarii pasilor 7 2 2 si 7 2 3 consta, de obicei, intr-un set de studii identificate ca relevante pentru tematica studiata insa nu toate studiile identificate sunt si eligibile pentru a fi incluse in metaanaliza De exemplu, unele studii nu au un design adecvat pentru a raspunde la intrebarea cercetarii Astfel, studiile de tip observational, non-experimental (cum ar fi demersul de stabilire a gradului de corelatie existent intre frecventa expunerii la jocuri video cu continut violent si comportamentul agresiv al adolescentilor) nu pot fi utilizate in metaanalize care isi propun obiective de tip cauza-efect, menite sa indice impactul jocurilor video violente asupra comportamentului agresiv la adolescenti Acest fapt este cauzat de ratiuni metodologice, deoarece doar studiile de tip experimental, insotite eventual de studiile cvasiexperimentale pot raspunde la intrebari ce vizeaza o relatie de tip cauza-efect (vezi capitolul 4) Desigur, acest filtru al tipului de studiu poate fi inclus inca de la inceput in analiza, atunci cand se realizeaza cautarea in baza de date, insa el nu poate fi aplicat in cazul studiilor obtinute prin utilizarea strategiilor alternative de cautare Mai mult, chiar daca am vorbi despre studii indexate in baze de date internationale, apare frecvent dificultatea imposibilitatea de a decide asupra calitatii (eligibilitatii) studiilor gasite daca se consulta doar rezumatul articolelor relevante Spre exemplu, daca intre criteriile de eligibilitate se specifica ideea ca, dintre studiile cvasiexperimentale, vor fi luate in considerare doar acelea pentru care exista dovezi privind absenta diferentelor dintre grupul experimental si cel de control la nivel de pretest, este posibil ca acest lucru sa nu fie precizat in sumarul articolului De aceea, pentru a stabili masura in care un studiu relevant este eligibil (indeplineste criteriile stabilite, vezi pasul 7 2 1), trebuie sa urmam, de regula, doi pasi: (a) screeningul rezumatelor articolelor relevante indexate in baze de date internationale (cu eliminarea celor care nu corespund criteriilor de eligibilitate prestabilite); (b) lecturarea articolelor care au trecut de acest prim filtru, pentru a verifica masura in care sunt indeplinite si alte criterii specificate (cele care nu pot fi stabilite din rezumatul articolului), dar si pentru a identifica alte articole relevante, ca parte a strategiei alternative de cautare a studiilor Cercetatorul poate decide in acest demers de analiza a eligibilitatii studiilor eliminarea celor care nu indeplinesc anumite criterii minimale de calitate De asemenea, cercetatorul poate decide cuantificarea calitatii studiilor considerate eligibile (acordarea de puncte) pentru a urmari impactul calitatii acestor studii asupra efectului studiat, adica masura in care aceste diferente calitative dintre studii afecteaza rezultatul final al metaanalizei in acest sens, vom oferi ilustrativ cazul ipotetic al unei metaanalize ce urmareste sa evidentieze relatia dintre tulburarea ADHD (deficit de atentie si hiperchinezie) si performanta la scolarii mici (ciclul primar) Un asemenea obiectiv (asocierea dintre variabilele X si Y) permite includerea studiilor non-experimentale, alaturi de demersuri de tip experimental insa pot exista diferente calitative intre studiile din aceeasi categorie De exemplu, fie studiile A si B doua studii de tip non-experimental, adica echivalente din perspectiva designului de cercetare folosit Totusi, studiul A poate fi considerat calitativ superior studiului B din perspectiva lotului utilizat daca participantii inclusi in grupul elevilor cu ADHD din studiul A sunt selectati in baza unui diagnostic pornind de la criteriile DSM-iV, evaluarea fiind realizata de catre doi evaluatori independenti, cu expertiza de zece ani in evaluarea psihiatrica, fata de cazul studiului B, in care participantii sunt inclusi in grupul copiilor cu ADHD pe baza nominalizarii facute de cadrele didactice, carora li s-a solicitat sa numeasca trei elevi din fiecare clasa care manifesta dificultati de concentrare in timpul orelor in mod similar, chiar daca ambele studii ar fi selectat elevii utilizand aceeasi metoda, cum ar fi aceea a luarii in considerare a unui diagnostic recunoscut oficial, studiile ar putea diferi calitativ daca intr-unul dintre ele se specifica faptul ca au fost controlate anumite variabile confundate ce pot influenta performanta scolara a elevilor Astfel, un studiu in care se precizeaza ca nu exista diferente la nivelul inteligentei generale intre copiii cu ADHD si cei din lotul de control (inteligenta generala fiind o variabila cu impact ridicat asupra performantei scolare a elevilor) are un nivel metodologic calitativ superior unui studiu in care nu se specifica daca cele doua grupe de copii (ADHD si de control) sunt echivalente din perspectiva nivelului de inteligenta Asadar, chiar intre studii de acelasi nivel, cum ar fi cele non-experimentale, pot exista diferente calitative cauzate de anumite strategii de lucru ce pot diminua sau spori amenintarile la adresa validitatii concluziilor studiului De aceste diferente ar trebui sa se tina seama in derularea unei metaanalize in acest sens au fost dezvoltate mai multe scale de evaluare a calitatii unui studiu, atat pentru studiile experimentale (vezi sintezele realizate de Moher si colaboratorii, 1995; 1996), cat si pentru studii de tip non-experimental (cum ar fi NOS - Newcastle-Ottawa Scale, dezvoltata de Wells si colaboratorii sai, 2008) Cu toate acestea, recomandarile oferite de Higgins si Green (2011), autorii celui mai celebru ghid de evaluare sistematica (Cochrane), sunt de a nu se utiliza asemenea scale de evaluare a unui articol, finalizate prin scoruri totale in schimb, se recomanda acordarea unui calificativ privind gradul de risc al unui articol de a avea rezultate distorsionate (validitate interna precara) indiferent de decizia luata, de a acorda un punctaj pentru calitatea articolului sau de a include articolul intr-o categorie de risc (scazut, ridicat sau neclar -informatii insuficiente) pentru a cuantifica ulterior impactul includerii excluderii acestor studii in din analiza, principiul ramane acelasi Rezultatele ar trebui insotite de o analiza a sensibilitatii pentru a identifica relatia existenta dintre variatii in calitatea studiilor incluse in analiza si magnitudinea efectului studiat 7 2 5 Realizarea bazei de date ca input pentru metaanaliza Realizarea bazei de date cu studiile eligibile constituie ultimul pas din procesul de evaluare sistematica in realizarea acestui demers se redacteaza, pe baza intrebarii de cercetare si a criteriilor de eligibilitate definitivate in pasul 7 2 1, un chestionar de analiza pentru fiecare studiu, utilizat atat pentru realizarea secventei 7 2 4, privind identificarea studiilor eligibile, cat si pentru realizarea efectiva a bazei de date, necesara pentru efectuarea analizelor statistice dorite (metaanalizei) Structura acestui chestionar ar trebui sa vizeze nu numai informatiile statistice necesare pentru calculul indicatorilor de marime a efectului, ci si informatii privind caracteristicile studiilor incluse in analiza din perspectiva metodologiei utilizate (design, participanti, instrumente etc ), necesare pentru realizarea demersului metaanalitic in acest sens, deseori se construiesc chiar mai multe baze de date, unele care sa vizeze caracteristicile studiilor incluse in analiza, altele care sa vizeze calculul marimii efectului pentru fiecare variabila dependenta de interes De asemenea, pentru a reduce riscul de codare gresita, chestionarele sunt insotite de un ghid de lucru (manual de codare), iar codarea efectiva are loc adesea dupa un scurt training (instructaj) cu rol clarificator in plus, daca numarul de studii eligibile este unul redus, codarea se poate realiza simultan de catre doi evaluatori independenti (realizandu-se o fidelitate inter-evaluatori a codarii), iar daca numarul de studii eligibile este unul ridicat, se pot alege la intamplare un numar de studii care sa fie codate independent de un alt evaluator, pentru a verifica fidelitatea codarii realizate Pentru a ilustra modul de colectare a datelor, vom apela la evaluarea eficientei programelor online de instruire comparativ cu stilul clasic de instruire fata in fata (pentru detalii, vezi US Department of Education, 2010) Criteriile de eligibilitate si intrebarile cercetarii sunt prezentate succint in tabelul 7 3, fiind urmate de o exemplificare a modului ipotetic de construire a chestionarului de colectare a datelor pe baza informatiilor solicitate Tabelul 7 3 Obiectivele studiului si criteriile de eligibilitate Caz ilustrativ Obiectivele evaluarii sistematice: 1 Compararea eficientei instruirii online vs fata in fata? 2 Ce caracteristici ale instruirii online cresc eficienta acesteia? Criterii de eligibilitate Definirea si operationalizarea Studiile eligibile includ interventiile de instruire realizate prin acceptabila a constructelor intermediul internetului, fie cu scopul de a inlocui in totalitate instruirea clasica (profesor si elev in aceeasi sala de clasa), fie cu scopul de a suplimenta instruirea directa, caz in care instruirea se numeste, in limba engleza, blended learning in analiza va fi cuprins orice tip de instruire online sau blended, fie ea una predominant expozitiva (cursantul citeste informatiile) sau una de tip participativ-activ (cursantul se implica activ, cum ar fi proiectele de colaborare dintre studenti si angajatori intr-o sarcina de tip aplicativ) De asemenea, sunt luate in considerare atat programele de instruire sincrone (de exemplu, teleconferintele, in care cursantul trebuie sa asiste online la o data si o ora prestabilite, cand are loc cursul), cat si cele asincrone (programe de instruire disponibile in orice moment, nefiind necesara prezenta cursantului online la o anumita data ora) Metaanaliza se va rezuma doar la acele programe disponibile pe internet, nefiind luate in calcul programe de instruire disponibile exclusiv pe CD-uri sau cele instalate local, pe un anumit calculator Pentru masurarea eficientei programelor sunt incluse doar studii care evalueaza obiectiv performanta scolara a cursantilor (note, medii, scoruri la teste standardizate) Nu vor fi incluse in analiza studii care vizeaza alte rezultate, cum ar fi atractivitatea programului de instruire masurata prin chestionare de autoraportare, modificari in preferintele (optiunile) studentilor pentru disciplina studiata etc Tipul studiilor acceptate Studiile eligibile sunt doar studiile experimentale sau cvasiexperimentale, cu conditia de a supune grupul de control unui program de instruire clasic (comunicare fata in fata) Felul participantilor Sunt inclusi participanti de toate varstele, de la toate nivelurile de studii, incepand cu scoala primara, indiferent de disciplina (tematica) cursului de instruire Contextul cultural Sunt incluse in analiza doar programele de instruire realizate in spatiul nord-american si european Data publicarii Nu exista un filtru temporal pentru includerea studiilor incluse in aceasta evaluare sistematica Limba publicarii Sunt incluse doar studiile publicate in limba engleza Tipul publicatiilor Se includ toate studiile relevante identificate, atat cele publicate in fluxul principal de informatii (de exemplu, articolele de specialitate), cat si cele provenite din zona gri a literaturii de specialitate (de exemplu, rapoarte ale unor cercetari realizate de agentii guvernamentale) Caseta 7 5 Un exemplu ipotetic de chestionar utilizat (codarea studiilor) Sectiunea A: iDENTiFiCATORi 1 iD studiu: 2 Autor prim: 3 Anul publicarii: 4 Tipul publicatiei A Carte sau capitol de carte B Articol C Teza de doctorat Disertatie D Raport tehnic E Comunicare la o conferinta F Alt tip Sectiunea B: PARTiCiPANti 5 Varsta medie 6 Nivelul cursului de instruire A Ciclul primar B Ciclul gimnazial D Ciclul universitar (licenta) E Ciclul universitar (master doctorat) F Cursuri postuniversitare (invatare continua) C Ciclul liceal 7 Rasa A > 60% albi B > 60% afroamericani C > 60% hispanici D esantion mixt (nicio rasa nu depaseste 60%) 8 Cursanti barbati (%): 9 Tipul cursantilor A normali B delincventi C cu cerinte educative speciale (handicap) D cu cerinte educative speciale (supradotati) Sectiunea C: DESiGN 10 Tipul studiului A Non-experimental B Experimental C Cvasiexperimental cu pretest D Cvasiexperimental cu pretest, dar fara echivalenta rezultatelor E Cvasiexperimental fara pretest F Neclar (nu se specifica daca exista randomizarea participantilor) 11 Nivelul randomizarii A individual B La nivel de clasa grup (cluster) 12 Tipul grupului de control A instruire clasica (fata in fata) B instruire online (alt model) C Absent 13 Nivel de retragere a participantilor A Sub 10% B intre 10 si 20% C peste 20% 14 Evaluarea globala a designului A Risc scazut de distorsiune B Risc ridicat de distorsiune C informatii neclare insuficiente Sectiunea D: CARACTERiSTiCi ALE VARiABiLEi iNDEPENDENTE 15 interventia A instruire online (exclusiva) B instruire mixta online + fata in fata (blended learning) 16 Stilul invatare solicitat A Pasiv (expozitiv) B Activ C interactiv 17 Derularea cursului online A Sincron B Asincron 18 Tipul cursului A Voluntar (intrinsec) B Obligatoriu de urmat (consecinte, motivatie extrinseca) 19 Durata cursului A sub 10 ore (volum de munca) B intre 11 si 20 de ore C intre 21 si 30 de ore 20 Continutul vizat A stiinte exacte si ale vietii B stiinte sociale 21 interactiunea cu alti colegi A Posibila fata in fata B Posibila online C Posibila mixt D intre 31 si 50 de ore E intre 51 si 100 de ore F peste 100 de ore C stiinte umaniste arta D Mixt D Absenta E Nespecificata Sectiunea E: ELiGiBiLiTATEA VARiABiLEi DEPENDENTE 21 Tipul de rezultat vizat A Nota scolara (scor test) C Atitudine preferinta pentru subiectul studiat B Nivelul de abandon al cursului D Alt tip Care? C Portofoliu de activitati Suplimentar fata de codarea datelor la nivelul studiului, de multe ori este nevoie de o codare a informatiilor colectate din studii la nivelul variabilei dependente Acest lucru este deseori util pentru ca pot fi colectati mai multi indicatori ai variabilei dependente, care vor trebui reuniti ulterior intr-un singur indicator compozit per studiu, pentru a nu incalca conditia de independenta a datelor colectate De exemplu, daca intr-un studiu au fost colectate rezultate de la acelasi esantion de subiecti cu privire la performantele scolare de la trei discipline (matematica, psihologie si limba germana), acestea vor fi ulterior insumate intr-un singur indicator compozit, daca analiza realizata vizeaza eficienta instruirii online in general, insa vom lua in considerare indicatorul adecvat (de exemplu, rezultatul la matematica) daca vom analiza eficienta instruirii online in predarea disciplinelor din domeniul stiintelor exacte De aceea, pentru a putea permite asemenea diferentieri, pe langa codarea studiilor ce reprezinta un nivel ierarhic superior de analiza se recomanda codarea separata a indicatorilor de marime a efectului pentru fiecare variabila dependenta masurata Aceasta codare separata vizeaza insa doar studiile declarate eligibile Caseta 7 6 Un exemplu ipotetic de chestionar utilizat (codarea marimii efectului) Sectiunea A: iDENTiFiCATORi 1 iD Studiu: 2 iD Marimea efectului (ES): Sectiunea B: CARACTERiSTiCi ALE VARiABiLEi DEPENDENTE 3 Nivelul comparatiei ES A Comparatie pretest B Comparatie posttest 4 Continutul disciplinei A stiinte exacte si ale vietii B stiinte sociale 5 Sarcina evaluarii notei A Test grila B Proiect Referat C Comparatie follow-up C stiinte umaniste arta D Mixt C Portofoliu mixt D Alta Care? Sectiunea C: CALCULAREA MaRiMii EFECTULUi 6 Tip de date disponibile A Medii, abateri standard, n grupe B F t si n grupe grade de libertate C Hi patrat 7 Pagina cu datele articolului: 8 Directia rezultatului A Online > control 9 n coloane necesare calcul D Frecvente E Valoarea exacta a pragului de semnificatie F Alte cazuri (De exemplu, consultand caseta 7 7, in cazul diferentelor intre medii avem nevoie de valorile m, s si n pentru grupul online, respectiv pentru grupul de control, ceea ce presupun adaugarea a sase coloane suplimentare; totusi, marimea efectului poate fi estimata si pe baza altor formule, situatie in care sunt introduse coloane suplimentare, in functie de datele disponibile ) 7 3 Metaanaliza 7 3 1 Calcularea indicatorilor de marime a efectului in privinta modului de calcul a indicatorilor de marime a efectului exista foarte multe surse bibliografice utile, cele recomandate fiind indeosebi lucrarile realizate de Borenstein et al (2009), Borenstein, Hedges, Higgins si Rothstein (2010), Hunter si Schmidt (1990 2004) sau Lipsey si Wilson (2001) De asemenea, astazi sunt disponibile o serie de programe statistice specializate pentru calculul indicatorilor de marime a efectului, precum Comprehensive MetaAnalysis (Borenstein et al , 2011), RevMan (Cochrane Collaboration, 2011), precum si aplicatii specifice gratuite in programe generale precum Microsoft Excel (DeCoster, 2011), dar si aplicatii de sine statatoare (de exemplu, Becker, 1999; Lyons si Morris, 2012) indiferent de sursa utilizata pentru demersul metaanalitic, se poate considera ca exista doua mari perspective de lucru: cea propusa de Hunter si Schmidt (1990 2004), respectiv cea propusa de Borenstein et al (2009) Primii sunt autorii unui demers denumit metaanaliza psihometrica sau metaanaliza componentelor esentiale (bare bones metaanalysis), viziunea lor fiind mai frecvent utilizata in psihologia organizationala si in cea a personalitatii, indeosebi pentru studii de tip corelational Cea de-a doua propunere vine din zona stiintelor medicale, avand un impact mai ridicat in psihologie clinica, psihoterapie, psihologie educationala, contexte in care demersurile comparative sunt intalnite mai frecvent Optiunea noastra pentru acest capitol este pentru modelul propus de Borenstein et al (2009), din urmatoarele ratiuni: (a) modelul are un impact major asupra dezvoltarii domeniului psihologiei clinice si psihoterapiei prin implicarea in alte proiecte precum Ghidul Cochrane de evaluare sistematica a interventiilor (Higgins si Green, 2011), in contextul in care psihologia clinica este cea mai extinsa specializare a psihologiei la nivel mondial; (b) modelul este insotit de un software usor de utilizat, ceea ce elimina o parte tehnica insemnata, scutindu-i pe cei interesati de realizarea metaanalizelor de povara calculului statistic asociat demersului metaanalitic; mai mult, la dezvoltarea acestui software au colaborat cei mai multi autori cu contributii insemnate in dezvoltarea si popularizarea domeniul metaanalizei ; (c) ofera o viziune mai realista de abordare a cazurilor in care se constata efecte eterogene; (d) constituie o abordare noua in literatura de specialitate din Romania, spre deosebire de modelul propus de Hunter si Schmidt pentru care exista deja surse bibliografice relevante (vezi metaanaliza corelatiilor, in Maricutoiu, 2008) Desi accentul este pus pe consideratiile practice ale utilizarii procedurilor metaanalitice propuse de Borenstein et al (2009), vom oferi si formulele de calcul necesare pentru demersul metaanalitic, in cazul in care nu se apeleaza la un software specializat in caseta 7 7 sunt prezentate formulele necesare pentru trei cazuri diferite intalnite in metaanalize: (a) compararea mediilor; (b) compararea frecventelor; (c) metaanaliza corelatiilor Caseta 7 7 Calcularea marimii efectului dupa Borenstein et al (2009) A Cazul comparatiilor dintre doua medii (t independent sau F avand primul df = 1) mE’ mC media grupului experimental, respectiv media grupului de control SE> SC abaterea standard din grupul experimental, respectiv cea din grupul de control пр, пр numarul de participanti din grupul experimental, respectiv cel din grupul de control t, r, N valorile testelor t student (grupe independente); r - coeficientul de corelatie liniara Bravais-Pearson; N - numarul total de participanti d, vj, marimea efectului (d Cohen); dispersia marimii efectului (vj); eroarea standard a marimii SEj efectului (SEj) g, Vg, marimea efectului ajustata (g Hedges); dispersia marimii efectului ajustate (vg); eroarea SEg standard a marimii efectului ajustate (SEg) w ponderea unui studiu in calculul mediei ponderate a marimii efectului (valabila pentru efecte fixe) , mF - mr а = c — Иn  - l)s'+(nc-l)s‘ d = t ln  + nc g J1 - 3 i   w +wc"- SAU ’ ПеПс • 4(и +ис-2)-l 1 Пе+Пс пЕпС B Cazul studiilor corelationale (r Bravais-Pearson) r, N valoarea coeficientului de corelatie (r); volumul esantionului z, vz, marimea efectului (calcul intermediar) (Z); dispersia marimii efectului (vz); eroarea SEz standard a marimii efectului (SEz) w ponderea unui studiu in calculul mediei ponderate a marimii efectului (valabila pentru efect fixe) 1 И' vs —= SEZ2 C Cazul comparatiilor dintre frecvente (hi patrat avand df = 1) A, B, C, frecvente observate in cele doua loturi comparate: grupul experimental (A - numar de D indivizi sanatosi; B - numar de indivizi nerecuperati) si grupul de control (C - numar de indivizi sanatosi; D - numar de indivizi nerecuperati) ln OR, logaritm natural din raportul sanselor (marimea efectului, calcul intermediar) (lnOR); vln OR, dispersia marimii efectului (VlnoR); eroarea standard a marimii efectului (SElnoR) SEln OR n, x2, d pi (valoarea matematica - 3,1416); valoarea hi patrat pentru un grad de libertate (df = 1); marimea efectului d al lui Cohen w ponderea unui studiu in calculul mediei ponderate a marimii efectului (valabila pentru efecte fixe) in 0), in timp ce rezultatele cu semnul minus indica d = 0,20 g = 0,20 in modul d = 0,50 g = 0,50 in modul d = 0,80 g = 0,80 in modul diferente in directia contrara (de exemplu, mg - mc 0), iar rezultatele subunitare (intre 0 si 1) indica diferente de frecvente mai mici in grupul experimental Rezultatele exprimate in log OR cu semnul plus indica diferente in directia asteptata (de exemplu, 1,45 sau 2,50 log OR = 0,35 log OR = in modul 0,90 in modul 4,00 log OR = 1,45 in modul f succes E - f succes C > 0) Rezultatele exprimate in log OR cu semnul minus indica diferente in directia contrara (de exemplu, f succes E - f succes C 0,05), fapt pentru care se poate spune ca tipul de participanti inclusi in studiu nu afecteaza magnitudinea corelatiei dintre constiinciozitate si absenteism 7 3 4 3 impactul procentual al variabilelor moderatoare indiferent daca se apeleaza la metaregresii sau la analiza diferentelor dintre subgrupuri, atunci cand se utilizeaza un model al efectelor random (nu este si cazul exemplului lucrat) se poate oferi un raspuns suplimentar Mai concret, se poate aprecia procentual impactul unei variabile moderatoare analizate luand in calcul totalul variatiilor observate in magnitudinea efectelor ce pot fi puse pe seama diferitelor caracteristici ale studiilor (procent din i2) Acest indicator poate fi interpretat similar cu indicatorul R2 intalnit in cazul regresiilor liniare, luand valori intre 0 si 100%, cu precizarea ca el explica procentual doar evolutia dispersiei determinate de diferite caracteristici ale studiilor (dispersia intergrup), nu si dispersia determinata de erorile de esantionare (dispersia intragrup) Asa cum am amintit, un astfel de indicator are sens doar in cazul unei metaanalize a efectelor random, deoarece in cazul metaanalizei efectelor fixe se porneste de la asumptia ca diferentele observate intre valorile marimilor efectului sunt cauzate exclusiv de erori de esantionare 7 3 5 Verificarea robustetii rezultatelor obtinute Dupa discutarea principalelor rezultate obtinute (nivelul si semnificatia mediei ponderate, nivelul de eterogenitate a datelor) si a surselor (caracteristici ale studiilor) care prezic variatii in magnitudinea efectului, sunt necesare cateva analize suplimentare care pot fi impartite in doua mari categorii: (a) analiza sensibilitatii rezultatelor; (b) analize ale gradului de distorsiune a rezultatelor pentru a vedea in ce masura rezultatele sunt afectate de studiile relevante neidentificate (nepublicate) 7 З 5 1 Analiza sensibilitatii rezultatelor Acest tip de analiza urmareste compararea rezultatelor obtinute in metaanaliza cu cele obtinute in situatia ipotetica in care am fi apelat la alte restrictii de selectare a studiilor De exemplu, o metaanaliza privind efectul terapiei cognitiv-comportamentale asupra reducerii simptomatologiei depresive la adolescenti ar putea fi realizata incluzand atat studiile de tip experimental (cu grup de control), cat si pe cele de tip cvasiexperimental (cu grup de control) O analiza a sensibilitatii ar urmari robustetea rezultatelor in contextul in care analiza cuprinde ambele categorii de studii sau doar pe cele experimentale in exemplul nostru cu privire la relatia dintre constiinciozitate si absenteism, sa presupunem ca trasatura de personalitate a fost evaluata in cinci dintre cazuri cu proba NEO-FFi (Costa si McRae, 1992), iar in alte doua cazuri cu un alt instrument valid pentru evaluarea constiinciozitatii O analiza de sensibilitate ar putea viza in ce masura rezultatele metaanalizei converg in aceeasi directie in cazul analizarii tuturor celor sapte studii fata de aceea in care am cuprinde doar cele cinci studii in care s-a utilizat NEO-FFi ca instrument de evaluare a personalitatii Pe scurt, prin analiza de sensibilitate se urmareste in primul rand sa se evidentieze impactul pe care diferite decizii de selectare (criterii de includere) a studiilor sau anumite decizii de calcul (efecte fixe sau random) il au asupra rezultatului metaanalizei Desigur, ideal ar fi ca efectele obtinute sa fie similare (robuste) indiferent de variatiile luate in calcul printre criteriile de includere a studiilor sau printre metodele de calcul utilizate Analizele de moderare mentionate in sectiunea 7 2 4 pot fi utilizate pentru a verifica robustetea efectelor, fiind de dorit sa nu existe un efect moderator semnificativ statistic 7 3 5 2 Analize ale gradului de distorsiune a rezultatelor in urma selectiei studiilor Oricat de mult s-ar stradui un cercetator sa gaseasca toate studiile relevante pe o anumita tematica, exista o probabilitate foarte mare ca unele studii sa nu fie incluse, si pentru simplul fapt ca o parte dintre studiile realizate nu ajung sa fie publicate sau macar comunicate in acest context, se pune problema masurii in care rezultatele ramase in "sertar" afecteaza rezultatele metaanalizei in acest scop au fost identificate o serie de proceduri menite sa indice: (a) nivelul riscului de a intalni un caz de distorsiune a rezultatelor ca urmare a esecului de a include toate studiile eligibile; (b) nivelul robustetii rezultatelor obtinute, in ciuda existentei unei distorsiuni in rezultatele metaanalizei; (c) impactul distorsiunii asupra rezultatelor Pentru primul nivel al discutiei, cel al identificarii riscului de a avea rezultate distorsionate, modalitatea tipica utilizata este norul de puncte de tipul palniei intoarse (simetrice; funnel plot) in mod normal, daca exista un risc ridicat de distorsiune, atunci norul de puncte nu este unul simetric, ci exista tendinta de a observa mai multe studii cu o marime a efectului scazuta in cazul studiilor efectuate pe esantioane mari de persoane (ce induc valori scazute ale erorii standard de masurare) decat in cazul studiilor efectuate pe esantioane reduse ca volum de persoane Acest lucru se intampla din cauza tendintei multor publicatii stiintifice de a accepta cu precadere articole in care se obtin rezultate semnificative statistic, asociate cu o probabilitate scazuta de a obtine un rezultat semnificativ statistic in contextul unui efect scazut si al unui esantion redus de participanti De aceea, premisa de la care se porneste este aceea ca studiile ramase nepublicate pot distorsiona rezultatul metaanalizei in cazul in care nu sunt semne de distorsiune, graficul ar trebui sa fie unul simetric, cu efecte mai ridicate sau mai scazute obtinute indiferent de volumul esantioanelor incluse in studiu, chiar daca in cazul studiilor efectuate pe un numar mare de respondenti variatia efectelor tinde sa scada, deoarece valorile respective se apropie in mai mare masura de media teoretica a efectului de la nivelul populatiei Un asemenea grafic se realizeaza in mod conventional prin exprimarea valorii marimilor efectelor pe axa orizontala si a volumului esantionului (sau a erorii standard de masurare) pe axa verticala Figura 7 5 Situatie indicativa pentru absenta distorsiunii de publicare (simetric; in stanga), respectiv pentru prezenta distorsiunii de publicare (asimetric; in dreapta) Totusi, desi metoda este intuitiva, ea are cateva neajunsuri ce merita semnalate: (a) pentru a fi aplicata este nevoie de un numar destul de ridicat de studii identificate (de exemplu, cel putin 20), deoarece este dificil de apreciat gradul de simetrie asimetrie atunci cand numarul de studii este unul foarte redus; (b) asimetria simetria este analizata subiectiv, la nivelul impresiei (perceptiei) cercetatorului, nefiind sustinuta de indicatori concreti; (c) in sfarsit, chiar daca se constata asimetria datelor, nu se poate determina calitatea studiilor neincluse in analiza, fiind posibil ca acele efecte mici sa fie cauzate de anumite probleme metodologice (variabile straine necontrolate), fapt care ar indreptati excluderea studiilor respective din analiza intr-un asemenea context nu ar fi corect sa vorbim despre distorsiunea rezultatelor din metaanaliza, ci despre o decizie corecta de excludere a acestora in privinta celei de-a doua limitari sesizate, cea legata de impresia subiectiva, unele programe specializate, precum Comprehensive MetaAnalysis, ofera indicatori suplimentari, cum ar fi coeficientul de corelatie a rangurilor al lui Begg si Mazumdar (1994) sau interceptul lui Egger et al (1997) Gasirea unui rezultat semnificativ in urma calcularii acestor indicatori obiectivi ar indica prezenta unei distorsiunii de publicare, insa trebuie mentionat faptul ca pragurile de semnificatie asociate acestor indicatori sunt adecvate in contextul unui numar suficient de mare de studii luate in calcul in caz contrar, pentru analize efectuate pe un numar redus de studii exista riscul obtinerii unor rezultate nesemnificative statistic, din cauza unei puteri statistice reduse, ceea ce nu ar insemna neaparat absenta distorsiunii determinate de neincluderea unor studii Prin urmare, pentru a aprecia corect riscul prezentei unei distorsiuni in rezultatele metaanalizei, toate metodele mentionate mai sus functioneaza eficient doar in contextul existentei unui numar destul de mare de studii incluse (cel putin 20) Pentru alte situatii, cum este cazul relatiei dintre constiinciozitate si absenteism in care au fost incluse doar sapte studii, acesti indicatori sunt mai putin relevanti, din cauza puterii statistice reduse de a decela distorsiunile existente Totusi, in contextul obtinerii de indicatori semnificativi statistic si a unui grafic de tip palnie evident asimetric, putem miza pe existenta unei distorsiuni a rezultatelor inclusiv in cazul unui numar redus de studii incluse O intrebare adiacenta legata de problema distorsionarii rezultatelor, mai ales in contextul in care se sesizeaza o asemenea tendinta, este aceea a identificarii numarului de studii de siguranta (fail-safe N) in varianta sa mai cunoscuta (clasica) propusa de Rosenthal (apud Borenstein et al , 2009; vezi Radu et al , 1993 pentru formula de calcul), se poate identifica numarul de studii care lipsesc avand un efect egal cu zero (de exemplu, r = 0,00) necesar pentru a schimba media marimii efectului dintr-un rezultat semnificativ statistic intr-unul nesemnificativ statistic Utilizand Comprehensive MetaAnalysis (Borenstein et al , 2011) pentru a obtine acest indicator in exemplul dat, vom observa ca ar fi nevoie de un numar de 47 de studii cu efect nul pentru a ajunge la concluzia ca nu exista o legatura intre constiinciozitate si absenteism, respectiv de un numar de 66 de studii cu efect nul pentru a ajunge la concluzia ca intre nivelul de neuroticism si absenteism nu exista o legatura semnificativa O alternativa de calcul realista si mai adaptata cerintelor practicienilor este cea propusa de Orwin Acesta permite estimarea numarului de studii neincluse in metaanaliza care ar schimba valoarea mediei ponderate a marimii efectului pana la un anumit nivel minim acceptat (de exemplu, in cazul corelatiilor un asemenea nivel ar putea fi r = 0,10, specific unui efect scazut, cu utilitate practica redusa) Cu alte cuvinte, metoda propusa de Orwin identifica numarul de studii necesare pentru a transforma un efect observat in unul fara relevanta practica deosebita, chiar daca efectul luat ca reper nu este nul De asemenea, acest indicator ii ofera cercetatorului flexibilitatea de a specifica pentru studiile neincluse, pe langa valoarea zero (absenta totala a efectului), si alte valori medii diferite de zero (de exemplu, un r mediu de 0,05 pentru studiile neincluse) Astfel, in contextul dat, ne-am putea intreba care este numarul necesar de studii neincluse pentru ca media ponderata a marimii efectului sa ajunga la un nivel minim acceptat de 0,10 (pentru relatia dintre neuroticism si absenteism), respectiv de -0,10 (pentru relatia dintre constiinciozitate si absenteism), in contextul in care media efectelor din studiile neincluse ar fi nula (r = 0,00) Utilizand un program specializat, precum Comprehensive MetaAnalysis (Borenstein et al , 2011), am obtine urmatoarele valori: doar 5 studii neincluse cu efecte nule ar fi necesare pentru a reduce marimea efectului la o valoare minim acceptabila de -0,10 pentru relatia dintre constiinciozitate si absenteism, respectiv doar 6 studii neincluse ar fi necesare pentru a reduce marimea efectului privind relatia dintre neuroticism si absenteism la un nivel minim ca valoare practica (r = 0,10) Desigur, aceste valori sunt valabile in contextul in care am specificat ca studiile neincluse ar avea o marime a efectului egala cu zero interpretarea acestor rezultate se face contextual De pilda, 5-6 studii neincluse semnifica un risc mare de distorsiune in date daca cercetatorul reuseste sa identifice 100 de studii eligibile, fiind posibil ca un procent de 5-6% din studii sa scape analizei Aceeasi valoare de 5-6 studii neincluse inseamna insa un risc mai scazut de distorsiune in cazul in care au fost identificate mai putin de 10 studii eligibile, desi au fost respectati pasii de evaluare sistematica a literaturii de specialitate Putem afirma acest lucru pentru ca este putin probabil sa scape analizei un procent de 50-60% din totalul studiilor relevante, daca evaluarea sistematica a fost realizata corect in sfarsit, o alta metoda de lucru in cazul identificarii unui risc crescut de distorsiune a datelor este metoda taierii si adaugirii (trim and fill) propusa de Duval si Tweedie (2000) Aceasta procedura iterativa porneste de la graficul de tip palnie intoarsa, incercand sa adauge sau sa elimine studii astfel incat sa se obtina un grafic simetric Desigur, o asemenea analiza este implementata doar daca se constata o distributie asimetrica a efectelor Din acest punct de vedere, demersul se apropie de ideea analizei sensibilitatii, raspunzandu-se la intrebarea: "Care ar fi media ponderata a marimii efectului daca nu ar exista distorsiunea de includere selectiva a studiilor?" Cu ajutorul programelor specializate, precum Comprehensive MetaAnalysis (Borenstein et al , 2011), se pot compara direct indicatorii importanti (medie, abatere standard, interval de incredere, eterogenitate), atat pentru cazul analizei rulate pe studiile identificate initial, cat si pentru cazul analizei realizate pe un set modificat de studii (obtinut prin adaugarea eliminarea unor efecte), astfel incat sa se reflecte o distributie simetrica, ceea ce semnifica absenta distorsiunii induse de studiile neincluse in analiza Concluzii Apelul la evaluarea sistematica a unei tematici prin intermediul tehnicii metaanalitice constituie principala modalitate de sistematizare a rezultatelor dintr-un domeniu de interes Metaanaliza nu are insa doar rolul unui demers sumativ, ci poate deschide noi directii de actiune (ridica noi intrebari de investigat) Calitatea rezultatelor unei metaanalize este dependenta de masura in care cercetatorul a inclus toate studiile relevante pentru tema de investigat, cat si de criteriile de selectie utilizate (de exemplu, metaanalizele care vizeaza identificarea unei relatii de tip cauza-efect includ doar studii experimentale) Orice evaluare sistematica ar trebui sa faca apel la cel putin doua baze de date independente si sa aplice strategii alternative de identificare a unor studii relevante in privinta metaanalizei, desi exista o multitudine de indicatori statistici disponibili, cel mai adesea un demers metaanalitic complet va face referire la: (a) prezentarea mediei efectului, a abaterii standard si sau a intervalului de incredere pentru aceasta, precum si a gradului de semnificatie a acestui rezultat (semnificativ sau nesemnificativ statistic); (b) analiza nivelului de omogenitate eterogenitate a efectului gasit (Q) si a masurii in care aceste variatii pot fi explicate de caracteristici ale studiilor (i2); (c) in cazul sesizarii unor efecte eterogene ce pot fi explicate de caracteristici diferite ale studiilor incluse, metaanaliza se completeaza cu metaregresii si analize de subgrupuri pentru a identifica rolul impactul fiecarei caracteristici relevante in dinamica marimii efectului analizat; (d) suplimentar, ar fi necesar sa se faca referiri la analiza sensibilitatii si a distorsionarii rezultatelor, pentru a aprecia nivelul de robustete al rezultatelor exprimate in ceea ce priveste metodele de lucru, cel mai potrivit model este cel al efectelor random, deoarece este putin probabil ca efectele observate de-a lungul studiilor sa varieze doar din cauza unor erori de esantionare in plus, acest model are avantajul de a extinde concluziile, dincolo de sfera studiilor analizate si se preteaza mai bine atunci cand sunt cuprinse mai multe studii (de exemplu, cel putin 15-20), lucru mai dificil de realizat in unele cazuri, mai ales daca se doreste realizarea unei serii de analize la nivel de subgrupuri Lecturi suplimentare Michael Borenstein, Larry V Hedges, Julian P T Higgins, Hannah R Rothstein (2009) introduction to MetaAnalysis Chichester, UK: Wiley Aceasta carte este fundamentala pentru cei care doresc sa inteleaga in profunzime aspectele prezentate pe parcursul acestui capitol, ea devenind foarte curand principala lucrare de referinta in domeniul metaanalizei Autorii cartii sunt cei care au introdus si programul adiacent mentionat in acest capitol, Comprehensive MetaAnalysis, acesta fiind disponibil gratuit, intr-o varianta demonstrativa cu termen de valabilitate limitata Julian P T Higgins, Sally E Green (2011) Cochrane Handbook for Systematic Reviews of interventions Version 5 1 0 (updated March 2011) Disponibil la http:  www cochrane-handbook org Referinta este utila indeosebi celor din zona psihologiei clinice si a psihoterapiei, fiind o lucrare necesara pentru a intelege pas cu pas ce inseamna si cum se realizeaza efectiv o evaluare sistematica Mark W Lipsey, David B Wilson (2001) Practicai MetaAnalysis Thousand Oaks, SUA: Sage Publications Recomand lucrarea indeosebi celor care au o formare umanista si care au intampinat dificultati in a intelege concepte din zona metodologiei cercetarii si a statisticii sociale Cartea este scrisa intr-un limbaj accesibil, oferind o imagine de ansamblu atat asupra evaluarii sistematice, cat si asupra demersului metaanalitic propriu-zis Laurentiu P Maricutoiu (2008) introducere in metaanaliza Metaanaliza corelatiilor Psihologia Resurselor Umane, 6, pp 112-127 Articolul detaliaza fundamentele metaanalizei si prezinta punctual pasii necesari pentru derularea unei metaanalize bazate pe studii corelationale, dupa modelul propus de Hunter si Schmidt (1994 2001), un model de lucru raspandit mai ales in domeniul psihologiei organizationale, o zona de cercetare in care predomina studiile de tip non-experimental Bibliografie APA (2011) PsyciNFO - American Psychological Association Gasit la adresa: http:  www apa org  pubs databases psycinfo index aspx Becker, L A (1999) Effect size calculators Gasit la adresa http:  www uccs edu  faculty lbecker  Begg, C B , Mazumdar, M (1994) Operating characteristics of a rank correlation test for publication bias Biometrics, 50, pp 1088-1101 Borenstein, M Hedges, L V , Higgins, J P T , Rothstein, H R (2009) introduction to MetaAnalysis Chichester: Wiley Borenstein, M , Hedges, L V , Higgins, J P T , Rothstein, H R (2010) Metaanalysis: Computing treatment effects and effect sizes Chichester: Wiley Borenstein, M , Hedges, L V , Higgins, J P T , Rothstein, H R (2011) Comprehensive MetaAnalysis Version 2, Biostat Gasit la www MetaAnalysis com Clark-Carter, D (2010), Quantitative psychological research: the complete student's companion (editia a ili-a) New York: Psychology Press Campbell Collaboration (2012) What is systematic review? Disponibil la adresa http:  www campbellcollaboration org  Cochrane Collaboration (2011) RevMan Gasit la adresa www cc-ims net revman Cohn, L D , Becker, L A (2003) How metaanalysis increases statistical power Psychological Methods, 8, pp 243-253 Cooper, H (2004) Research synthesis and metaanalysis A step by step approach (editia a iV-a) Thousand Oaks: Sage Costa, P T , McRae, R R (1992) Revised NEO personality inventory and NEO-five-factor inventory: Professional manual Odessa FL, USA: Psychological Assessment Resources David, D , Szentagotai, A , Lupu, V , Cosman, D (2008) Rational emotive behavior therapy, cognitive therapy, and medication in the treatment of major depressive disorder: A randomized clinical trial, post-treatment outcomes, and six-month follow-up Journal of Clinical Psychology, 64, pp 728-746 DeCoster, J (2004) Metaanalysis notes Gasit la adresa http:  www stat-help com notes html DeCoster, J (2011) Microsoft Excel Spreadsheets Disponibil la adresa http:  www stat-help com spreadsheets html Duval, S , Tweedie, R (2000) A nonparametric "trim and fill" method of accounting for publication bias in metaanalysis Journal of the American Statistical Association, 95, pp 89-99 Egger, M , Davey Smith, G , Schneider, M; Minder, C (1997) Bias in metaanalysis detected by a simple, graphical test British Medical Journal, 315, pp 629-634 Field, A (2001) Metaanalysis of correlation coefficients: a Monte Carlo comparison of fixed- and random-effects methods Psychological Methods, 6, pp 161-180 Field, A (2003) Can metaanalysis be trusted? The Psychologist, 16, pp 642-645 Field, A (2005) Metaanalysis in J Miles si P Gilbert (eds ), A Handbook of Research Methods in Clinical & Health Psychology (pp 295-308) Oxford: Oxford University Press Green, S G , McDonald, S (2005) The Cochrane Collaboration: More than systematic reviews? internal Medicine Journal, 35, pp 4-5 Hedges, L V , Olkin, i (1985) Statistical methods for metaanalysis Orlando: Academic Press Higgins J P T , Green S (eds ) (2011) Cochrane Handbook for Systematic Reviews of interventions Version 5 1 0 [updated March 2011] The Cochrane Collaboration, 2011 Disponibil la: www cochrane-handbook org Higgins, J P T , Thompson, S G Deeks, J J , Altman, D G (2003) Measuring inconsistency in metaanalyses British Medical Journal, 327, pp 557-560 Hunter, J E , Schmidt, F L (2004) Methods of MetaAnalysis: Correcting Error and Bias in Research Findings (editia a il-a) Thousand Oaks: Sage Linden, W , Phillips, M J , Leclerc, J (2007) Psychological treatment of cardiac patients: A metaanalysis European Heart Journal, 28, pp 2972-2984 Lipsey, M W , Wilson, D B (2001) Practical Metaanalysis Thousand Oaks: Sage Lyons, L C , Morris, W A (2012) The MetaAnalysis Calculator Disponibil la adresa http:  www lyonsmorris com ma1 index cfm Maricutoiu, L P (2008) introducere in metaanaliza Metaanaliza corelatiilor Psihologia Resurselor Umane, 6, pp 112-127 Maricutoiu, L P , Sava, F A (2007) PowerStaTim 1 0 - Analiza puterii statistice si a marimii efectului Disponibil la: www psihologietm ro McDaniel, M A (2005) Big-brained people are smarter: A metaanalysis of the relationship between in vivo brain volume and intelligence intelligence, 33, pp 337-346 Moher, D , Jadad, A R , Nichol, G , Penman, M , Tugwell, P , Walsh, S (1995) Assessing the quality of randomized controlled trials: An annotated bibliography of scales and checklists Controlled Clinical Trials, 16, pp 62-73 Moher, D , Jadad, A R , Tugwell, P (1996) Assessing the quality of randomized controlled trials: Current issues and future directions international Journal of Technology Assessment in Health Care, 12, pp 195-208 Morris, S B , DeShon, R P (2002) Combining effect size estimates in metaanalysis with repeated measures and independent-groups designs Psychological Methods, 7, pp 105-125 Mulrow, C D (1994) Systematic reviews: Rationale for systematic reviews British Medical Journal, 309, pp 597-599 Olejnik, S , Algina, J (2003) Generalized eta and omega squared statistics: Measures of effect size for some common research designs Psychological Methods, 8, pp 434-447 Radu, i , Miclea, M , Albu, M , Moldovan, O , Nemes, S , Szamoskozy, S (1993) Metodologie psihologica si analiza datelor Bucuresti : Sincron Spring, B (2007) Evidence-based practice in clinical psychology: What it is, why it matters; what you need to know Journal of Clinical Psychology, 63, pp 611-631 US Department of Education, Office of Planning, Evaluation, and Policy Development (2010) Evaluation of evidence-based practices in online learning: A metaanalysis and review of online learning studies Washington DC, disponibil la adresa www ed gov about offices list opepd ppss  reports html Wells, G A , Shea, B , O'Connell, D , Peterson, J , Welch, V , Losos, M , Tugwell, P (2008) The Newcastle-Ottawa Scale (NOS) for assessing the quality of nonrandomised studies in metaanalyses disponibil la adresa: http:  www ohri ca programs clinical epidemiology oxford htm Wikipedia (2012) List of academic databases and search engines disponibil la adresa: http:  en wikipedia org wiki List of academic databases and search engines Dintre sintezele de tip narativ, cel mai intalnit tip este sinteza teoretica (Cooper, 2004) Aceasta are rolul de a evalua comparativ teoriile utilizate pentru a vedea care dintre ele explica mai bine anumite fenomene, punand accent pe descrierea unor experimente critice pentru a diferentia intre teorii, pe dovezile empirice care contrazic sau sprijina anumite modele teoretice si pe anumite reformulari modificari conceptuale necesare pentru a nu respinge o anumita teorie (revizuiri ale teoriilor) Conform Campbell Collaboration (2012), o sinteza a literaturii de specialitate poate fi denumita evaluare sistematica daca indeplineste urmatoarele criterii: (a) se bazeaza pe criterii clare de includere excludere a studiilor; (b) specifica explicit strategia utilizata pentru cautarea studiilor; (c) foloseste un sistem de codare a variabilelor de interes din studiile selectate in baza unui manual de codare; (d) se finalizeaza printr-o metaanaliza (daca este posibil) Pentru o lista extinsa a bazelor de date internationale existente, recomand consultarea Wikipedia (2012) Maricutoiu (2008) introduce pentru publicul de la noi aceasta forma de metaanaliza, discutand cazul particular al metaanalizei corelatiilor Printre cei care au colaborat la realizarea acestui program se regasesc: David Wilson, Betsy Becker, Julian Higgins, Will Shadish, Hannah Rothstein, Michael Borenstein, Larry Hedges, Harris Cooper si Mark Lipsey O exceptie in care putem lua in analiza mai multi indicatori output proveniti din acelasi studiu este cazul in care suntem interesati sa urmarim in cadrul metaanalizei daca instrumentele de lucru constituie o variabila moderatoare (de exemplu, daca efectul terapiei asupra simptomatologiei depresive este moderat de tipul de instrument utilizat - Beck sau Hamilton) Pentru a raspunde punctual la acest aspect, vom lucra nu cu un esantion de studii, ci cu un esantion de marimi ale efectelor, fapt ce ne va permite sa testam daca exista diferente semnificative de marime a efectului intre studiile care au utilizat proba Hamilton, respectiv proba Beck O alta exceptie este cazul in care urmarim efecte pe paliere diferite De exemplu, intr-un studiu care vizeaza efectul jocurilor video cu continut violent asupra agresivitatii la copii pot fi analizate separat efectele produse la nivelul cognitiilor agresive si cele care vizeaza comportamentul agresiv Field (2001), in baza unei simulari de tip Monte Carlo, concluzioneaza ca in cazul metaanalizei efectelor random aplicate in cazul corelatiilor, atat pentru metoda descrisa (Borenstein et al , 2009, bazata pe Hedges si Olkin, 1985), cat si pentru metoda propusa de Hunter si Schmidt (2004), apare un risc crescut de eroare de tip i daca sunt utilizate cel mult 15 studii Studiile metaanalitice, comparativ cu cele empirice (primare), au o putere statistica mult mai mare (indeosebi metaanaliza efectelor fixe), crescand sansele de a gasi efecte semnificative statistic Sugestiv ar fi exemplul amintit de Cohn si Becker (2003), al unei metaanalize ce vizeaza impactul unui tratament medicamentos aplicat pacientilor care au suferit un infarct miocardic Desi in 27 dintre cele 33 de studii incluse in metaanaliza au fost observate efecte nesemnificative statistic, efectul mediu rezultat din metaanaliza a fost unul semnificativ statistic, scazand cu 20% riscul mortalitatii in randul pacientilor care au beneficiat de tratamentul respectiv Dupa unii autori, precum Field (2003), a cunoaste acesti factori moderatori este mai important decat rezultatele generale (media ponderata a marimii efectului) in sine in aceasta directie, Field (2003) apeleaza la o parabola elocventa, aceea a realizarii unei metaanalize pe baza a trei studii, efectuate pe un numar egal de participanti, in care s-au obtinut urmatoarele efecte ale unui medicament miraculos care sa-i ajute pe studenti sa inteleaga cunostintele de statistica: d = 0,45 (in studiul din SUA), d = 0,00 (in studiul din Belgia) si d = -0,45 (in studiul din Marea Britanie) Cititorii neutri ar putea concluziona ca medicamentul este unul ineficient, deoarece media celor trei studii este 0 insa aceasta concluzie ar fi valabila doar pentru belgieni, deoarece in SUA medicamentul a functionat, iar in Marea Britanie a avut efecte adverse, contrar celor asteptate De aceea, mai important decat media in sine este sa vedem care e nivelul de omogenitate eterogenitate al efectului de-a lungul studiilor si sa gasim care sunt acele variabile moderatoare responsabile pentru variatiile observate in marimea efectului Capitolul 8 Raportarea rezultatelor in articole de specialitate Calitatea unei cercetari poate fi subminata sau intarita de capacitatea autorilor de a asterne in scris rezultatele cercetarilor lor Forma consacrata de comunicare a acestor rezultate este cea a articolelor de specialitate, supuse procesului de evaluare colegiala (peer-review papers) Daca articolul este coerent si bine structurat, le va fi mai usor atat evaluatorilor, cat si publicului cititor sa inteleaga aspectele importante ale studiului, crescand sansele publicarii, respectiv sansele ca articolul sa aiba un impact mai ridicat printre specialisti Mai mult, capacitatea autorilor de a scrie ofera adesea indicii cu privire la maturitatea lor, cazurile de articole scrise foarte clar fiind mult mai frecvente printre cercetatorii cu experienta decat printre cercetatorii tineri tinand cont de aceste considerente, in acest capitol vom prezenta o serie de recomandari privind structurarea unui articol de specialitate, dar si privind procesul editorial asociat acestui demers La fel ca in cazul celorlalte capitole, accentul va fi pus de aspectele aplicative, pragmatice, pentru a-i ajuta pe cei interesati sa valorizeze la maximum potentialul cercetarilor realizate sau in curs de realizare Ne vom referi indeosebi la articolele empirice (cele care presupun colectarea si analiza unor date de catre cercetatori), dar vom face unele referiri si la alte categorii de articole cum sunt cele din zona studiilor de sinteza: studiile metaanalitice si sintezele narative (teoretice) O alta precizare necesara este aceea ca ne vom focaliza asupra structurarii articolelor adresate unui public-tinta cunoscator (reviste cu nivel ridicat de specializare) si mai putin asupra publicarii unor articole in reviste de popularizare 8 1 Anatomia unui articol empiric Acest tip de studiu este, de departe, cel mai raspandit tip de articol stiintific, deoarece sub aceasta forma sunt cuprinse toate studiile primare, bazate pe colectarea si analiza datelor Datorita raspandirii acestui tip de studiu, structura articolelor empirice pare familiara atat specialistilor, cat si cititorilor aflati in perioada de formare profesionala (studenti, masteranzi), ea putand fi inteleasa, intr-o forma simpla, ca o structura in patru pasi: introducere ("Care este problema investigata?"), metodologia cercetarii ("Cum a fost investigata problema?"), rezultate ("Ce rezultate s-au gasit?") si discutii ("Ce implicatii relevanta au aceste rezultate?") (Hali, 2008) Totusi, intr-o forma extinsa am putea vorbi de opt sau chiar noua sectiuni ale unui articol empiric in forma sa publicata (Cooper, 2011): titlu, nota autorului, rezumat (abstract), introducere, metodologia cercetarii, rezultate, discutii, bibliografie si, eventual, anexe (materiale suplimentare disponibile online) Asupra fiecaruia dintre aceste aspecte ne vom opri in continuare, facand o serie de recomandari specifice 8 1 1 Titlul articolului Alegerea titlului pentru articolele din domeniul psihologiei ar trebui sa tina seama atat de recomandarile din domeniu (de exemplu, APA recomanda ca titlul sa nu depaseasca 12 cuvinte , fiind preferate formularile concise; APA, 2010), cat si de principalele trei calitati pe care ar trebui sa le aiba un titlu Aceste calitati sunt: a fi informativ (sa nu induca in eroare), a fi atractiv (sa trezeasca interesul cititorilor) si a include cuvinte-cheie (sa creasca sansele de identificare ulterioara a articolului de catre cei care vor cauta articole pe tema respectiva in baze de date internationale (Moss, 2008) Din perspectiva formei titlului, in domeniul psihologiei sunt utilizate frecvent doua tipuri de titluri: nominale si compuse (Budgell, 2009) in categoria titlurilor nominale se regasesc acele titluri formate dintr-o afirmatie care contine ideea principala a articolului Titlurile compuse sunt formate din doua parti Prima parte poate fi o intrebare, poate fi un artificiu retoric sau o descriere succinta a aspectelor-cheie din studiu, in timp ce in partea a doua sunt oferite precizari suplimentare cu privire la tipul studiului, la alte caracteristici metodologice esentiale ale studiului este Caseta 8 1 Exemple de titluri Exemple de titluri nominale 1 Efectul terapiei familial-sistemice asupra adolescentilor cu depresie majora 2 Relatia dintre angajamentul organizational si fluctuatia de personal a cadrelor didactice 3 inteligenta generala ca predictor al performantei extra-rol la angajatii din industria usoara 4 impactul gradinitei cu program prelungit asupra achizitiilor educationale si a starii de bine a prescolarilor Exemple de titluri compuse Descriere succinta + detaliu metodologic 1 Tipuri de personalitate in baza modelului Big Pive: o analiza de cluster pe populatia din Romania 2 Efectul terapiei rational-emotive in reducerea cognitiilor irationale la delincventi: un studiu clinic controlat 3 Relatia dintre personalitate si absenteismul de la locul de munca: o metaanaliza Artificiu retoric + descriere succinta (+ detaliu metodologic) 4 Noi credem in moderatie: personalitate si abilitati de munca in echipa 5 Partea intunecata a predarii: o metaanaliza a impactului comportamentelor didactogene ale profesorului asupra elevilor intrebare + detaliu metodologic (alte aspecte) 6 Sunt eficiente programele de training pentru parintii copiilor cu ADHD? O metaanaliza 7 Tutoriate online vs tutoriate fata in fata: care sunt mai eficiente? Un studiu longitudinal Dupa cum se poate constata din caseta 8 1, titlurile nominale sunt cele mai succinte si mai apropiate de esenta problemei investigate, daca ar fi sa ne raportam la modelul Pi(C)O de formulare a problemei de cercetat Pe de alta parte, asemenea formulari tind sa atraga mai putin atentia (cel putin comparativ cu formularile retorice) si sa fie mai putin utile pentru cercetatorii interesati sa distinga inca din titlu despre ce fel de studiu este vorba (de exemplu, o metaanaliza, un studiu randomizat, un studiu longitudinal etc ) 8 1 2 Nota autorului Scopul acestei mini-sectiuni (author note) este de a prezenta autorii articolului si eventualele circumstante speciale care ar trebui cunoscute de catre publicul cititor Standardele APA (2010) recomanda standardizarea acestui proces, prin cuprinderea urmatoarelor informatii: (a) numele autorului (autorilor) si afilierea institutionala si departamentala a acestora la momentul derularii studiului, respectiv in prezent (numai pentru autorii care si-au modificat intre timp afilierea institutionala); (b) multumiri aduse (pentru sprijinul financiar primit in derularea studiului - numarul grantului, institutia finantatoare etc -respectiv pentru contributia adusa la reusita studiului de catre persoane care nu sunt incluse in lista de autori); (c) alte precizari explicite necesare in cazuri speciale (precizarea situatiilor in care exista un conflict de interese; mentionarea eventualelor studii publicate anterior care se bazeaza pe acelasi esantion sau aceeasi baza de date; specificarea faptului ca ordinea autorilor nu reflecta contributia lor la articol, toti avand contributii egale etc ); (d) date ale persoanei de contact Caseta 8 2 Exemplu de nota a autorului Adaptare dupa Sava, Yates, Lupu, Szentagotai si David (2009) Florin A Sava, Departamentul de Psihologie Clinica si Psihoterapie, Universitatea "Babes-Bolyai" din Cluj-Napoca; Brian T Yates, Departamentul de Psihologie, American University, Washington DC; Viorel Lupu, Departamentul de Fiziologie, UMF "luliu Hateganu" din Cluj-Napoca; Aurora Szentagotai, Departamentul de Psihologie, Universitatea "Babes-Bolyai" din Cluj-Napoca; Daniel David, Departamentul de Psihologie Clinica si Psihoterapie, Universitatea "Babes-Bolyai" din Cluj-Napoca Florin A Sava este afiliat in prezent la Departamentul de Psihologie, Universitatea de Vest din Timisoara Multumiri: aceasta cercetare a fost sustinuta de institutul Albert Ellis, de CNCS si de Centrul Roman de Psihoterapie Cognitiv-Comportamentala, prin granturile 113, 33374, respectiv 9) Aceasta publicatie se bazeaza pe aceeasi baza de date utilizata in articolul mentionat mai jos Daca in articolul respectiv s-a urmarit exclusiv compararea eficientei celor trei interventii in combaterea depresiei majore, acest articol abordeaza comparativ raporturile cost-eficienta si cost-utilitate pentru cele trei interventii David, D , Szentagotai, A , Lupu, V , & Cosman, D (2008) "Rational emotive behavior therapy, cognitive therapy, and medication in the treatment of major depressive disorder: A randomized clinical trial, posttreatment outcomes, and six-month follow-up", Journal of Clinical Psychology, 64, 728-746 Date de contact: corespondenta pentru acest articol ar trebui trimisa catre Florin A Sava, Departamentul de Psihologie, Universitatea de Vest din Timisoara, Bd Vasile Parvan nr 4, 300223, Timisoara, Romania,   afsava@socio uvt ro Pentru autorii care si-au schimbat afilierea din momentul realizarii studiului pana in momentul publicarii acestuia, cutuma este sa se treaca ca afiliere institutia de care autorul apartine in momentul realizarii studiului 8 1 3 Rezumatul articolului si cuvintele-cheie Modul de redactare a rezumatului unui articol este dependent, intr-o anumita masura, de recomandarile revistei in care se intentioneaza a fi publicat articolul, fiind intalnite formate mai scurte (pana la 150 de cuvinte) sau mai lungi (pana la 200-250 de cuvinte) Primele sunt scrise, de regula, sub forma unui singur paragraf (rezumate narative), celelalte sub forma structurata in cateva mici sectiuni (rezumate structurate) (Budgell, 2009) in caseta 8 3 este prezentat cate un exemplu pentru fiecare dintre cele doua tipuri de rezumate, precum si un exemplu de rezumat pentru cazul articolelor cu studii multiple indiferent de formatul de redactare, formatul JARS recomanda includerea in rezumat doar a datelor de tip factual (fara aprecieri sau judecati de valoare), care sa faca referire la: (a) problema investigata (background si sau obiectivul studiului); (b) detalii despre participanti; (c) detalii-cheie despre metodologia studiului; (d) rezultate; (e) concluzii implicatii aplicatii Desigur, acest gen de raportare este functional indeosebi atunci cand articolul respectiv raporteaza un singur studiu Pentru articolele care contin mai multe studii, nivelul de abstractizare creste Caseta 8 3 Exemple de rezumate Adaptare dupa Sava, Maricutoiu, Rusu, Macsinga si Virga (2011) -136 de cuvinte Relatia dintre credintele irationale si evaluarile explicite, respectiv implicite ale stimei de sine a fost investigata in doua studii corelationale independente (N1 = 117; N2 = 102), efectuate pe studenti de la nivelul ciclului de licenta in ambele studii cognitiile irationale si stima de sine explicita au fost evaluate prin GABS-SV, respectiv scala Rosenberg, in timp ce stima de sine implicita a fost evaluata in primul studiu prin testul asocierilor implicite (iAT), iar in al doilea studiu prin proba initialelor numelui Doua rezultate robuste (replicate) indica existenta unei corelatii negative intre stima de sine explicita si autoblamare, o credinta irationala specifica, precum si absenta unei corelatii intre nivelul stimei de sine implicite si oricare dintre credintele irationale Aceste rezultate sugereaza ideea ca disputarea cognitiilor irationale in cadrul interventiilor psihoterapeutice afecteaza doar cognitiile explicite, cele implicite ramanand nealterate Adaptare dupa Sava, Yates, Lupu, Szentagotai si David (2009) -198 de cuvinte Obiectiv Studiul compara raportul cost-eficienta in cazul utilizarii terapiei cognitiv-comportamentale (TCC), respectiv al fluoxetinei (Prozac) pentru tratamentul depresiei majore intr-un studiu clinic controlat Participanti si design 110 adolescenti romani nepsihotici, aflati la primul episod diagnosticat de depresie majora, au fost distribuiti randomizat in doua grupe: TCC (N = 56) si fluoxetina (N = 54) Ambele interventii s-au derulat saptamanal, timp de 14 saptamani Variabilele dependente principale Nivelul depresiei a fost evaluat in trei momente diferite (pretest, posttest si follow-up la sase luni distanta) prin scala de depresie Beck Rezultate Ambele forme de interventie reduc semnificativ statistic nivelul depresiei, raportandu-ne la nivelul existent la pretest Nu exista diferente semnificative intre TCC si fluoxetina cu privire la eficienta lor in combaterea depresiei majore (d Cohen = 0,07 [-0,13; 0,22] la nivel de posttest, respectiv 0,02 [-0,12; 0,15] la nivel de follow-up) in schimb, TCC a obtinut un raport cost-eficienta mai bun decat fluoxetina, datorita costurilor mai scazute: mediana 26,44 USD zi fara depresie pentru TCC, respectiv 34,93 USD zi fara depresie pentru fluoxetina implicatii Rezultatul raportului cost-eficienta este dependent de contextul economic, costul serviciilor de psihoterapie fiind mai scazut decat costul farmacoterapiei in tari cu economii emergente Din perspectiva utilitatii unui rezumat, acesta indeplineste doua functii majore: (a) sa prezinte clar, intr-o maniera concisa, ideea si rezultatele unui studiu, fiind primul si, de multe ori, singurul paragraf citit dintr-o cercetare (aspect ilustrat in caseta 8 3); (b) sa creasca sansele ca articolul sa fie citat, prin facilitarea regasirii acestuia in baze de date internationale Cu privire la cea de-a doua perspectiva, voi prezenta doua recomandari utile: • sunt preferabile formularile cu un nivel redus de abstractizare; de exemplu, in loc sa se spuna ca este vorba de 110 participanti, este preferabil sa spunem ca este vorba de 110 adolescenti din Romania; acest lucru va ajuta la identificarea articolului in baze de date internationale (de exemplu, cineva interesat sa identifice eficienta diferitelor forme de terapie pentru adolescenti va introduce, foarte probabil, intre cuvintele-cheie in limba engleza termeni precum teenagers sau adolescents; daca in rezumat vom trece cuvantul participanti si daca titlul nu contine referiri exacte la populatia-tinta, articolul nostru nu va fi selectat pe baza celor doua cuvinte specificate; reversul nu este insa valabil deoarece daca cineva este interesat de nivelul eficientei terapiei la nivel global, e putin probabil sa introduca termeni generici, precum participants, preferand sa se focalizeze pe alte cuvinte-cheie; aceeasi recomandare de a utiliza termeni categoriali cat mai concreti este valabila si pentru alte aspecte, precum tipul de studiu sau instrumentele utilizate; de exemplu, ar fi dezirabil sa se faca referire la tipul de studiu, astfel incit in locul unor exprimari de genul in this study ar fi mai bine sa fie precizat exact tipul studiului (in this correlational study; in this randomized trial) pentru a usura munca de selectare a studiilor relevante atunci cand alti autori sunt interesati de o anumita tipologie de studii; • daca rezumatele sunt generoase ca numar de cuvinte permise, este recomandabil sa fie prezentate explicit rezultatele obtinute astfel incat sa poata fi valorificate rezultatele articolului in metaanalize (vezi al doilea exemplu din caseta 8 3); acest lucru este util deoarece multe baze de date indexeaza doar rezumatul articolelor, dar chiar si pentru articolele indexate integral exista multe situatii in care accesul la acestea se face doar in regim contra cost Desigur, formatele pentru rezumat prezentate anterior se refera la cazul studiilor empirice Pentru alte tipuri de studii, cum sunt evaluarile sistematice, este preferabil un model structurat cu sase puncte (Budgell, 2009) - obiectiv, sursa datelor, selectia studiilor, metode de extragere a datelor, rezultate sintetice si concluzii -, precum cel prezentat in caseta 8 4 Detalii despre alte tipuri de studii (metodologice, teoretice, studii de caz etc ) se gasesc in manualul oficial al standardelor de publicare APA (2010) Caseta 8 4 Exemplu de rezumat pentru o metaanaliza Adaptare dupa Szentagotai si David (2010) - 214 cuvinte Obiectiv Scopul studiului este de a realiza o metaanaliza cu referire la efectul terapiei cognitiv-comportamentale (TCC) ca tratament adjuvant la medicatie in cazul pacientilor diagnosticati cu depresie bipolara Sursa datelor Au fost incluse articolele publicate in perioada 1980-2008, selectate din baza de date Medline Cuvintele-cheie utilizate au fost: cognitiv si tulburare bipolara, terapie cognitiva si tulburare bipolara, terapie cognitiv-comportamentala si tulburare bipolara Selectia studiilor Criteriile de includere se refera la: (a) studii clinice controlate in care una dintre interventii este TCC; (b) existenta unui grup de control care primeste doar medicatie; (c) existenta datelor suficiente pentru calculul marimii efectului Metode de extragere indicatorul d Cohen a fost utilizat pentru calcularea marimii efectelor, acestea fiind reunite apeland la modelul metaanalizei efectelor aleatorii Rezultate A fost obtinut un efect scazut spre moderat al impactului adjuvant al TCC la nivel de posttest (d = 0,42, p 85, in baza unei testari initiale) Exemplificare (prezentare selectiva adaptata a unor fragmente de text) Lotul de participanti a fost selectat dintr-un esantion initial format din 120 de studenti supusi unei evaluari psihologice Criteriile de eligibilitate pentru studiu au fost urmatoarele: (a) participantii sa se afle la prima lor experienta de evaluare printr-o masura de tip implicit; (b) sa nu aiba in istoricul personal vreo suferinta care sa fi necesitat interventie psihiatrica; (c) sa nu prezinte vreo tulburare de personalitate din axa ii a DSM-iV, in baza evaluarii psihologice realizate De asemenea, pentru a fi inclusi in analiza participantii trebuiau sa completeze sarcina SMP de evaluare a constiinciozitatii la nivel implicit, conform instructajului, fiind exclusi cei care au completat superficial sarcina (care au avut la mai mult de 10% din cazuri un timp de reactie pentru raspuns sub 100 ms) Caracteristicile participantilor Aici sunt prezentate informatii utile despre caracteristicile participantilor inclusi in studiu: de tip demografic (varsta, sex, status [lot clinic vs lot neclinic]) sau variabile relevante pentru problema studiata (daca este cazul) Astfel, in final au fost analizate rezultatele provenite de la 98 de participanti (82%) Cinci studenti au fost exclusi din analiza pentru ca nu indeplineau criteriile de eligibilitate, iar alti 17 pentru nerespectarea instructajului Caracteristicile demografice pentru cei 98 de participanti inclusi in analiza indica o proportie mai ridicata de studenti de sex feminin (75%) si varste cuprinse intre 19 si 31 de ani (M = 21,2; SD = 3,8) Descrierea procedurii de esantionare Se precizeaza ce fel de procedura a fost Procedura de recrutare a studentilor a fost utilizata pentru constituirea una de tip neprobabilistic, bazata pe esantionului de participanti convenienta, in baza unui anunt postat electronic pe site-ul universitatii Precizari referitoare la aspectele etice Se refera la consimtamantul informat Participantii eligibili pentru acest studiu au de a fi subiecti ai cercetarii si la semnat un formular de consimtire eventualele beneficii oferite informata a participarii lor la studiu si au fost recompensati cu un punctaj pentru efortul lor voluntar Alte precizari tehnice O ultima componenta de inclus cu ocazia descrierii participantilor face referire la puterea statistica a studiului Tot aici trebuie precizat daca exista alte publicatii pornind de la esantionul studiat (daca este cazul) Deoarece este prima data cand se incearca utilizarea sarcinii SMP pentru a masura implicit nivelul constiinciozitatii, se observa ca cei 98 de participanti analizati asigura o putere statistica de 0,70 pentru a surprinde asocieri de intensitate medie (moderata, r = 0,25), intre aceasta variabila centrala si masura explicita a constiinciozitatii criteriile comportamentale incluse instrumente (masuratori) - ilustrare selectiva Fie ca este vorba de teste psihologice, de sarcini creative, de masuratori fiziologice etc , sunt prezentate succesiv, pornind de la cele mai relevante, cum ar fi conceptul central al lucrarii sau variabilele dependente principale (primary outcomes), si Sarcina SMP a fost utilizata pentru a surprinde nivelul implicit al constiinciozitatii (C SMP) Pentru a implementa C SMP am apelat la aplicatia software Direct RT v 2008 (Empirisoft, 2008) Sarcina implica prezentarea succesiva pe finalizand cu cele cu o relevanta mai scazuta in cazul testelor, modelul clasic de redactare implica o trimitere bibliografica catre instrumentul utilizat, scurte detalii legate de interpretare si referiri succinte la caracteristicile psihometrice Totusi, daca probele sunt mai putin cunoscute, acest ultim aspect poate fi dezvoltat in cadrul unui paragraf intreg in cazul utilizarii unor aparaturi sau in situatia apelarii la unele sarcini de laborator, acestea sunt descrise in detaliu, daca nu exista vreo referinta bibliografica ce contine aceste detalii De asemenea, sunt foarte utile precizarile suplimentare cu privire la calitatea datelor colectate, indeosebi pentru sarcini mai putin standardizate sau pentru cele construite ad-hoc Ne referim aici, fara a ne rezuma doar la acestea, la aspecte precum: dovezi din pretestare cu referire la anumite proprietati ale instrumentelor; la experienta celor care implementeaza interventiile psihoterapeutice; performanta in evaluarea codarea observatiilor in baza unor grile; verificarea reusitei manipularii experimentale ecranul calculatorului a 32 de perechi de stimuli (amorsa + tinta) Stimulii-amorsa fac referire la 16 descriptori adjectivali specifici unui nivel ridicat al constiinciozitatii (de exemplu, sarguincios), si la 16 descriptori adjectivali relevanti pentru un nivel scazut al constiinciozitatii (de exemplu, lenes) Acestia au fost selectati dintre descriptorii adjectivali recunoscuti ca specifici pentru cei doi poli ai C (Schmuckle si Egloff, 2008) Stimulii-tinta constau intr-o serie de pictograme chinezesti, neutre din punct de vedere semantic (datorita opacitatii lor) si afectiv in acest sens, toate pictogramele chinezesti au fost evaluate ca fiind neutre afectiv intr-un pretest in care li se cerea participantilor sa evalueze pe o scala de la 1 (neplacut) la 7 (placut) valenta fiecarei pictograme in parte (N = 50, M = 4,26, SD = 0,31) Cele 32 de amorse au fost prezentate intr-o ordine aleatorie, fiind imperecheate, tot aleatoriu, cu stimulii-tinta in fiecare dintre cele 32 de secvente, stimulul-amorsa a fost prezentat in centrul ecranului, cu caractere Arial 16, pentru o perioada de 200 ms Stimulul era apoi inlocuit cu un dreptunghi alb (5 x 2 cm) timp de 125 ms, totalizand un SOA de 325 ms Dupa disparitia dreptunghiului alb, apare stimulul-tinta timp de 200 ms, cu dimensiunea pictogramei de 5 x 2 cm Apoi pictograma este inlocuita de un dreptunghi de culoare gri de aceleasi dimensiuni, care ramane pe ecran pana la inregistrarea raspunsului Aspectul inovativ implicat de SMP este faptul ca li se cere participantilor sa evalueze pentru fiecare pictograma in parte daca aceasta ar fi potrivita sa fie imprimata pe un tricou personalizat sau nu in evaluarea daca pictograma i se potriveste sau nu, i se atrage atentia celui testat sa nu se lase influentat in decizia sa de semnificatia stimulului-amorsa care preceda fiecare pictograma evaluata Pentru a cota C SMP s-a acordat cate un punct pentru fiecare pictograma aleasa ca fiind potrivita, daca aceasta era precedata de un stimul-amorsa din zona polului ridicat al C, respectiv pentru fiecare pictograma respinsa (nepotrivita), daca aceasta era precedata de un stimul-amorsa din zona polului scazut al C Astfel, scoruri ridicate sunt indicative pentru un nivel crescut al constiinciozitatii masurate implicit Consistenta interna masurata in acest caz prin metoda injumatatim indica o valoare acceptabila pentru C implicit, de 0,64) Scala C din proba NEO-FFi (Costa si McRae, 1992) a fost utilizata pentru surprinderea nivelului explicit al constiinciozitatii Scala C contine 12 itemi in format Lickert cu 5 trepte, scorul total fiind obtinut prin insumarea celor 12 itemi Scoruri ridicate la scala C din NEO-FFi indica un nivel crescut al C explicite, consistenta interna pentru acest studiu fiind de 0,76 Procedura Aspecte ce tin de colectarea datelor Sunt oferite informatii cu privire la contextul cercetarii (locatie, contextul testarii, succesiunea probelor), iar uneori detalii suplimentare (cum ar fi instructajul verbatim) pentru masuratori esentiale sau o referinta bibliografica pentru acestea Participantii au fost testati in varianta creion-hartie, in grupuri de 5-10 persoane, in cazul masurilor explicite, respectiv individual, la calculator, intr-o camera izolata fonic, in cazul C SMP Ordinea de prezentare a instrumentelor a fost: mai intai C SMP, apoi setul de probe explicite (acestea din urma fiind contrabalansate ca ordine de prezentare) Aspecte ce tin de Se refera la managementul datelor Pentru a analiza sintetic relatia dintre C analiza datelor colectate (date care lipsesc, prelucrari SMP, respectiv C NEO-FFi, cu indicatorii preliminare ale lor etc ) comportamentali, acestia au fost regrupati prin metoda componentelor principale intr-un singur scor global Dintr-o perspectiva sintetica, aceasta sectiune metodologica ar trebui sa ne ajute sa vedem esenta calitatii studiului, cel putin cu privire la: (a) "Pe ce populatie a fost facut studiul si in ce masura rezultatele pot fi generalizate in alte contexte?" (validitate externa); (b) "Ce fel de masuratori au fost efectuate si ce incredere avem in aceste masuratori, respectiv in procedurile de colectare a lor?" (validitate de construct); (c) "in ce masura designul ales si variabilele incluse sunt potrivite pentru a raspunde adecvat la obiectivul studiului?" (validitate interna); (d) "in ce masura informatiile prezentate in aceasta sectiune sunt suficient de detaliate pentru a permite replicarea studiului (validitate externa) si pentru a aprecia ca reduse riscurile obtinerii unor rezultate distorsionate, ca urmare a unor deficiente in implementarea studiului si sau a necontrolarii unor variabile straine (validitate interna) sau a unui numar insuficient de participanti (validitate statistica)?" Data fiind importanta deosebita a acestor intrebari, este de la sine inteles ca modelul prezentat in tabelul 8 3 este un model minimal, util mai degraba pentru a descrie studii non-experimentale de tip corelational Aceste specificatii trebuie adaptate in functie de caracteristicile fiecarui tip de studiu in conformitate cu prevederilor specificate in standardele asociate acestora (vezi tabelul 8 2) 8 1 6 Rezultate A treia sectiune majora dintr-un articol empiric este aceea in care sunt prezentate rezultatele La fel ca in cazul sectiunii de metodologie a cercetarii, structura sectiunii de rezultate variaza mult in functie de tipul de studiu derulat si de problematica investigata (obiectivul urmarit) De aceea, se recomanda utilizarea acelorasi standarde specifice specificate in tabelul 8 2 pentru a redacta acurat aceasta parte din articol in cele ce urmeaza vom prezenta cateva sugestii generale cu privire la redactarea acestei sectiuni, dar si unele aspecte punctuale care ar trebui sa se regaseasca in sectiunea de rezultate Mentiuni generale pentru sectiunea de rezultate (Priebe, 2008; Thompson, 1999): • de regula, sectiunea de rezultate contine: (a) paragrafe de text in care se expune semnificatia datelor prezentate, insotita de dovezi statistice (tehnice) care sa o sustina (de exemplu, se constata un nivel mai scazut al anxietatii sociale la participantii care au urmat terapie cognitiv-comportamentala decat la cei din grupul de control - t(23) = 3,43, p 0,10 ") Din aceste tabele nu ar trebui sa lipseasca indicatorii descriptivi relevanti precum numarul de participanti, mediile si abaterile standard De asemenea, in cazul studiilor de tip corelational supuse unor analize statistice multivariate (regresii, analize factoriale etc ) ar trebui sa fie prezentata si matricea de corelatii dintre variabile in cazul in care nu exista trimiteri la tabele figuri, afirmatiile din text ar trebui sustinute de rezultatele statistice efective (de exemplu, C SMP coreleaza pozitiv cu indicatorul global C explicit: r(96) = 0,34, p < 0,01) Din motive de fluenta a textului se prefera insa pastrarea unui text curat, lipsit de elementele tehnice care sa ingreuneze citirea si intelegerea in schimb, tabelele (figurile) ar trebui sa contina informatiile tehnice (dovezile) care sustin aceste afirmatii Sectiunea de discutii contine adesea referiri la patru dintre cei sase factori identificati ca determinanti in aprecierea calitatii unui articol (Sternberg si Gordeeva, 1996) Cei patru factori sunt importanta teoretica, valoarea pentru studiile viitoare, acuratetea metodologica si importanta practica a rezultatelor La acestia se adauga doi factori mai generali: actualitatea temei si calitatea prezentarii (adica respectarea recomandarilor precizate in tabelele 8 2-8 6) Dupa cum se poate sesiza pe parcursul intregii carti, exista o diferenta intre standardele de redactare a bibliografiei conform APA, editia a Vi-а (APA, 2010), exemplificate in tabelul 8 6, si standardele adoptate de Editura Polirom pentru colectiile sale Daca articolul nu are alocat un DOi (digital object identifier, specificat, de obicei, pe prima pagina a unui articol disponibil online) se trece sintagma "Gasit la" (Retrieved from), urmata de adresa electronica a revistei Daca revista nu are pagina web (reviste care si-au incetat aparitia), dar articolul este identificat tot in mediul online, atunci se specifica, in locul adresei web a revistei, adresa web a bazei de date unde a fost gasit (de exemplu, www eric com) in sfarsit, daca articolul exista doar in format tiparit, referinta bibliografica se incheie dupa precizarea numerelor de pagina, fara a mai fi specificat vreun DOi sau vreo adresa de web Alte doua programe, cu functii similare, intalnite frecvent sunt EndNote si Reference Manager, insa acestea sunt disponibile contra cost sau sunt dependente de accesul la baza de date iSi Web of Science in domeniul medical, criteriile grupului Vancouver pentru autorat sunt mult mai dure, solicitand autorilor sa indeplineasca concomitent toate cele trei criterii: contributie substantiala in conceperea designului si studiului sau in analiza ori interpretarea datelor; contributie substantiala in scrierea sau revizuirea articolului; acordul cu privire la versiunea finala a studiului (vezi Horton, 2008, sau Parmley, 1997) Simmons et al (2011) evidentiaza variatii in decizia de eliminare a unor participanti din studii experimentale bazate pe timpi de reactie (TR), sub motivul ca un timp de reactie prea scurt semnifica o procesare superficiala raspunsuri intamplatoare Acest timp prea scurt poate varia in functie de interesele cercetatorului: de la praguri absolute de genul 100 ms, 150 ms sau 200 ms, la exprimari relative in termeni de "x" abateri standard peste medie, unde x poate varia de la un studiu la altul, in functie de decizia cercetatorului Au fost dezvoltate o multime de aplicatii informatice (de exemplu, puteti cauta pe internet plagiarism software), multe dintre acestea fiind disponibile gratuit Dezavantajul lor este ca pot detecta doar pasaje comune scrise in aceeasi limba (de exemplu, un articol scris in engleza din surse scrise in aceeasi limba), fiind irelevante pentru fraude de tipul unor traduceri extinse (cuvant cu cuvant) din engleza in romana sau viceversa Aceasta problema apare de obicei in domeniul artistic si in domeniul media, in care creatii anterioare sunt utilizate pentru a produce efecte lucrari noi (de exemplu, o Mona Lisa cu mustata) Transpunerea acestui principiu in domeniul psihologiei ar insemna permisiunea de a utiliza portiuni de text scrise anterior in lucrarile noi ale aceluiasi autor sau al altor autori daca acest fapt are un rol inovator vizeaza scopuri diferite De exemplu, portiuni dintr-un articol care abordeaza problematica cost-eficienta a unei interventii psihoterapeutice pot fi reproduse intr-un manual introductiv de metodologia analizelor de tip economic in psihoterapie pentru a ilustra modul de realizare a unei astfel de analize, daca se respecta regulile de citare, respectiv drepturile de autor Vezi acuzatiile de plagiat aduse persoanelor din conducerea unei universitati din Romania, care apoi au incercat sa se disculpe dand vina pe un alt coautor (un doctorand care a abuzat de increderea lor, plagiind din lucrarea unui alt autor, fara stiinta acestora) O lista a revistelor cu acces liber, inclusiv din domeniul psihologiei (158 de reviste) poate fi consultata in DOAJ (Directory ofOpen Access Journals - www doaj org) Cele mai multe reviste cu acces liber se autofinanteaza prin perceperea unei taxe de publicare de la autorii articolelor acceptate, in ciuda acestui dezavantaj evident, strategia este in continua extindere datorita celorlalte avantaje majore: scurtarea duratei de publicare, respectiv o probabilitate mai ridicata de acceptare a articolului Pana la urma, editorul este cel care ia decizia de a publica sau respinge un manuscris El ia decizii in baza analizei facute de catre evaluatorii desemnati si in baza propriilor reflectii cu privire la articol De cele mai multe ori, aceste decizii converg, insa pot exista cazuri in care articolul este acceptat spre publicare in ciuda unor critici majore venite din partea unui evaluator sau situatii de recomandari favorabile din partea evaluatorilor urmate de decizia editorului de a respinge articolul (insa asemenea situatii sunt intalnite doar in cazul revistelor de top, unde concurenta acerba impiedica publicarea unor articolele bune) 